譬如前幾天做的 English Grammar Tests 課程,來源是PDF檔案。這個PDF非圖片轉成的,所以文字可複製,省了不少力氣,但是萬一是圖片呢? 其實也是有解的,只是要用OCR來處理,這就考驗到如何 OCR 的能力了。之前在 Test your vocabulary 4 開始製作之初,我利用OCR將大部分的 Answers 轉出來,再用 Office 的文字檢查功能快速的檢查過一遍。在很短的時間便完成了答案 Key-in 的工作,這就是具備 OCR 能力才能做得到的。
回到 Grammar Tests 課程來看...雖然是文字可以直接取得,但是必須變成下列這種資料才能成為 SMC 可用的來源:
但是複製出來的文字卻是這樣,題目答案是分開的,題目如下...
Speaking already
Q1 Can you hear what he is .......?
(a) saying
(b) speaking
(c) telling
(d) talking
Q2 She hasn't come home ........
(a) still
(b) already
(c) yet
(d) till
A1 Can you hear what he is saying?
answer: (a) saying
A2 She hasn't come home yet.
answer: (c) yet
如何將這分散的文字,快速的轉成下面這樣的形態呢?
Can you hear what he is ##?
坦白說...如果你會編程,這個對你而言不是問題,寫幾行程序就可以很快的全部處理完成,但是如果你沒有這方面的能力,光 是靠手動輸入,可就得耗費相當長的時間了。記得之前看過勝間和代教如何學習的書曾提到一些必須具備的能力,其中一項就是編程能力,當時覺得這或許不應該是 必須的吧..但是現在突然覺得,少了這一點卻會差很多。
沒有留言:
張貼留言