Anonim

אחד הדברים שלעתים תסכלו אותי הוא חוסר היכולת להעתיק טקסט בקלות מתמונות וקבצי PDF מסוימים (למשל כאלה שאולי נוצרו ממסמכים סרוקים). למרבה המזל, לאורך זמן פותחו פתרונות תוכנה לטיפול בבעיה זו, מה שמאפשר חיסכון משמעותי בזמן שאחרת היה מבלה בהעתקה ידנית והקלדת טקסט מחדש. בטיפ של היום, אני מדבר על כלי תוכנה חינמי בשם Capture2Text המשתמש באלגוריתם OCR (Optical Character Recognition (OCR)) שיאפשר ללכוד טקסט מקבצי תמונה וקבצי PDF.

התקנה והתקנה

כדי להתחיל, המשך לדף SourceForge של הפרויקט והורד את הגרסה האחרונה של Capture2Text. התוכנה מגיעה כארכיון zip ובאותה שעה אינה כוללת מתקין ייעודי. לאחר ההורדה, פתח את הארכיון והפעל את הקובץ Capture2Text.exe. פעולה זו תפעיל את התוכנה ותניח אייקון במגש המערכת:

ראשית, מה תרצו לעשות זה להגדיר את העדפות התוכנה, ספציפית באילו מקשים חמים (או קיצורי דרך) להשתמש בכדי להתחיל ולהפסיק את הלכידה:

במקרה שלי בחרתי להשתמש במקשי "Windows + q" כדי להתחיל ללכוד וב- "Enter" כדי לעצור אותו. אתה יכול להתאים אפשרויות אלה למה שהכי מתאים לך. זכור כי מקש "Windows + s" משמש לרוב לצילום מסך (למשל על ידי תוכניות כמו Microsoft One Note).

בכרטיסייה הבאה ניתן להגדיר אפשרויות OCR כולל שפת הקלט (כרגע נתמכות בשבע שפות) והאם להשתמש בעיבוד מוקדם של OCR כדי לשפר את הדיוק (מומלץ מאוד). לבסוף, בלשונית הפלט, בין אפשרויות אחרות ניתן לבחור אם פשוט לשמור את הטקסט שנלכד בלוח או האם להפעיל חלון קופץ נפרד.

שימוש בתוכנה

לאחר התקנת והתצורה של התוכנה, תוכלו להתחיל להשתמש בה באמצעות שילוב מקשים חמים ללכידת התחלה. בחר בעכבר, בחר את האזור בתמונה הכולל את הטקסט שברצונך לצלם. כדי להפסיק את הלכידה, פשוט לחץ על המקש החם שבחרת להפסיק את הלכידה. לאחר מכן יועתק הטקסט ללוח, לחלון קופץ פלט או לשניהם. דוגמה ניתן לראות להלן.

מהבדיקה המהירה שביצעה לי בכלי עם תמונות מצאתי כי הדיוק שלו הוא הגון. ברור שיש מגבלות לכלים כמו זה ו- OCR בכלל. לדוגמה, טקסט ששונה בכבדות (מאוד סקרני, נטוי או מודרני) עשוי לא לעבוד טוב כל כך, ולפעמים בכלל לא. כמו כן, בחלק מהמקרים זה יעזור להתאים מעט את מידות תיבת הלכידה או לשחק עם הזום בתמונה עצמה כדי לקבל תוצאה מדויקת יותר.

בעת צילום טקסט ממסמכי PDF סרוקים, הדיוק בסדר, עם כמה שינויים סופיים בדרך כלל עדיין נחוצים בפלט שנלכד (תלוי באיכות הסריקה הראשונית). כמו כן, שמתי לב שהתוכנה עשויה להימשך מספר שניות יותר לעיבוד, במיוחד כאשר מתבקשים להמיר כמויות גדולות של טקסט.

עם זאת, בסך הכל אני חושב שהכלי עושה עבודה טובה, מה גם שהוא זמין בחינם - אני ממליץ לך לנסות זאת.

תוספת 11/16/2015:

כאופציה נוספת, עבור אלה שיש להם חשבונות גוגל, ניתן להשתמש גם ביכולות ה- OCR של גוגל על ​​ידי העלאת קובץ לכונן Google שלך ​​(פרטים נוספים ניתן למצוא כאן). יתר על כן, יש גם תוסף OCR זמין עבור משתמשי Google Chrome בשם Copyfish שאולי תרצה לבדוק גם.

כיצד ללכוד טקסט מתמונות עם תוכנת ocr