OCR หรือ Optical character recognition เป็นเทคนิควิธีการแปลงข้อความที่เป็นรูปภาพเป็นข้อความจริงๆ ขยายความนิดหนึ่งครับ ยกตัวอย่างเช่น เราแสกนงานเอกสารเป็น pdf จะได้ไฟล์ pdf ที่เป็นรูปภาพข้อความ โดยที่เราไม่สามารถ copy ข้อความเอาไปใช้งานต่อได้ ด้วยปัญหานี้จึงเกิดเทคนิค OCR ขึ้นมา เพื่อทำการแปลงรูปภาพข้อความ เป็น ข้อความจริงๆ
ซึ่งโปรแกรม OCR นี่จำเป็นมากครับสำหรับท่านที่ต้องการแปลงไฟล์ pdf เป็นข้อความ เพราะบางทีเราต้องนำข้อความในเอกสารมาใช้ ต้องมานั่งพิมพ์ใหม่ ทำให้ยุ่งยากมากครับ และเสียเวลาด้วย เอาโปรแกรมนี้ไปใช้จบเลยครับ
pdfocr เป็น freeware เราสามารถโหลดไปใช้งานได้ฟรีๆครับ สามารถดาวน์โหลดได้ที่นี่ (Download pdfocr) ขนาดไฟล์ install ประมาณ 10 mb โดยประมาณ ณ วันที่ผมทดสอบโปรแกรมนี้ปลอดภัยไร้ spyware ครับ
จากนั้นทำการติดตั้ง ในขั้นตอนการติดตั้ง บ่มีหยังหลายหรอกครับ คลิก next ไปเรื่อยๆก็สามรถใช้งานได้แล้ว หลังจากติดตั้งเสร็จ เปิดโปรแกรมแล้วคลิกเปิดไฟล์ pdf (pdf ไฟล์ จะอยู่ในแบบข้อความ หรือรูปภาพข้อความ ก็ได้) จากนั้นกดปุ่ม start ocr แล้วทำการเลือกหน้าที่ต้องการแปลงไฟล์ ดังรูปครับ

ถ้าแปลงหลายหน้าก็รอนิดหนึ่งครับ จากที่ผมทดสอบ หน้าหนึ่งที่เป็นข้อความล้วนๆประมาณ 10-20 วินาที ผมว่าก็เร็วดีนะ เมื่อโปรแกรมแปลงเสร็จเราก็ได้ ข้อความดังรูปครับ

ข้อจำกัดโปรแกรมนี้เท่าที่รู้คือ ไม่ support ภาษาไทย ส่วนเรื่องอื่นๆผมว่าเป็น ocr software อีกตัวที่น่าใช้งานครับ


Seung
on May 19th, 2010
@ 10:13 am:
Thank you so much na ka