Optical Character Recognition (OCR)

Guru OCR ระบบอัตโนมัติสำหรับแปลงเอกสารกระดาษและไฟล์รูปภาพเอกสารเป็นข้อมูลตัวอักษร

ในปัจจุบันเอกสารต่างๆ จำนวนมากนิยมจัดเก็บและจัดการโดยใช้คอมพิวเตอร์เป็นหลักเพราะข้อดีหลายๆ ด้านของคอมพิวเตอร์ เช่น การจัดเก็บข้อมูลที่ไม่ต้องใช้เนื้อที่มาก การค้นหาที่รวดเร็ว การนำข้อมูลไปใช้ต่อได้อย่างสะดวกสบาย แต่อย่างไรก็ตามบ่อยครั้งที่เราหลีกเลี่ยงไม่ได้ที่จะต้องยุ่งเกี่ยวกับเอกสารกระดาษ เช่น เอกสารสัญญาต่างๆ เอกสารกระดาษที่รับมาจากที่อื่น หรือเอกสารที่ได้รับทางโทรสาร ถึงแม้ว่าเอกสารกระดาษเหล่านี้จะสามารถสแกนเข้าไปเก็บไว้ในคอมพิวเตอร์ได้ แต่ก็จะอยู่ในรูปแบบของรูปภาพซึ่งนำไปใช้งานต่อได้ไม่สะดวก

โปรแกรมแปลงรูปสแกนของเอกสารเป็นข้อมูลตัวอักษร หรือ Optical Character Recognition (OCR) จึงถูกนำมาใช้เพื่อแก้ปัญหานี้ อย่างไรก็ดีภาษาไทยเป็นภาษาที่ยากต่อการประมวลผลและไม่ค่อยมีผู้พัฒนา OCR อย่างจริงจัง ทำให้ OCR ภาษาไทยยังใช้งานจริงได้ไม่ดีนัก

ด้วยเหตุนี้ Guru Square ซึ่งเป็นผู้เชี่ยวชาญด้านการประมวลผลภาษาไทยจึงได้พัฒนา Guru OCR ขึ้นมาเป็นระบบสำหรับดึงข้อความออกมาจากรูปสแกนของเอกสารได้โดยอัตโนมัติ ซึ่งมีประสิทธิภาพ และรองรับการทำงานได้ทั้งกับเอกสารภาษาไทยและภาษาอังกฤษ และผลจากการแปลงข้อมูลนี้จะสามารถนำไปใช้ต่อยอดในธุรกิจได้อีกมากมาย เช่น ใช้ในการค้นหาข้อความที่อยู่ภายในเอกสารเหล่านั้นและเมื่อผนวกกับ Guru Search และการใช้ร่วมกับโปรแกรมอ่านข้อความด้วยเสียง VAJA จึงทำให้การใช้ Guru OCR เป็นการอำนวยความสะดวกที่จะช่วยให้การจัดการเอกสารในระบบคอมพิวเตอร์เป็นไปอย่างสมบูรณ์