Jak převést obrázek do textu pomocí aplikace ABBYY FineReader?

Tento článek bude doplněk k předchozímu (https://pcpro100.info/skanirovanie-teksta/) a podrobněji odhalí podstatu přímého rozpoznávání textu.

Začněme samou podstatou, kterou mnoho uživatelů zcela nerozumí.

Po skenování knihy, novin, časopisu atd. Získáte sadu obrázků (tj. Grafických souborů, ne textových souborů), které musíte rozpoznat ve zvláštním programu (jeden z nejlepších je ABBYY FineReader). Rozpoznávání je a je proces získávání textu z grafiky a je to ten proces, který budeme psát podrobněji.

V mém příkladu si vezmu snímek obrazovky z tohoto webu a pokusím se získat z něj text.

1) Otevření souboru

Otevíráme obrázky, které plánujeme rozpoznat.

Mimochodem, je třeba poznamenat, že můžete otevřít nejen obrazové formáty, ale také například soubory DJVU a PDF. To vám umožní rychle rozpoznat celou knihu, která se v síti obvykle distribuuje v těchto formátech.

2) Úpravy

Okamžitě souhlasit s automatickým rozpoznáním velkého smyslu není přítomen. Pokud, samozřejmě, máte knihu, ve které můžete pouze text, žádné obrázky a tablety, a naskenované ve vynikající kvalitě. V ostatních případech je nejlepší nastavit všechny oblasti ručně.

Obvykle je nejprve třeba odstranit nepotřebné oblasti ze stránky. Chcete-li to provést, klepněte na tlačítko Upravit na panelu.

Pak musíte opustit pouze oblast, se kterou chcete pracovat déle. K tomu slouží nástroj pro ořezávání zbytečných okrajů. Na pravé straně sloupce vyberte režim oříznutí .

Potom vyberte oblast, kterou chcete zachovat. Na následujícím obrázku je zvýrazněno červeně.

Mimochodem, pokud máte několik otevřených obrázků, lze oříznutí použít na všechny snímky najednou! Je výhodné neříznout každý samostatně. Dávejte pozor, v dolní části tohoto panelu je další skvělý nástroj - gumu . Pomocí tohoto obrázku můžete vymazat zbytečné skvrny, čísla stránek, skvrny, nepotřebné speciální znaky a jednotlivé oblasti.

Po klepnutí na oříznutí okrajů by se původní obrázek měl změnit: zůstane pouze pracovní plocha.

Potom můžete opustit editor obrázků.

3) Výběr oblastí

Na panelu nad otevřeným obrázkem jsou malé obdélníky, které určují oblasti skenování. Existuje několik z nich, zkrátka zvažte nejčastější.

Obrázek - tato oblast nerozpozná program, prostě zkopíruje zadaný obdélník a vloží jej do uznaného dokumentu.

Text je hlavní oblastí, na které se má program zaměřit a pokusit se o získání textu z obrázku. Tuto oblast vybíráme v našem příkladu.

Po výběru je oblast namalována v světle zelené barvě. Poté můžete pokračovat v dalším kroku.

4) Rozpoznávání textu

Po nastavení všech oblastí klikněte na příkaz menu, který chcete rozpoznat. Naštěstí v tomto kroku není nic co dělat, je zbytečné.

Doba rozpoznávání závisí na počtu stránek v dokumentu a síle počítače.

V průměru jedna celá stránka skenovaná v kvalitě trvá 10-20 sekund. na průměrné síle PC (podle dnešních standardů).

5) Kontrola chyb

Bez ohledu na původní kvalitu obrazu byly obvykle po rozpoznání vždy chyby. Totéž, zatím žádný program není schopen zcela vyloučit práci člověka.

Klepněte na možnost zaškrtnutí a program ABBYY FineReader začne střídavě zobrazovat místa v dokumentu, kde měl chybu. Vaším úkolem, porovnáním původního obrázku (mimochodem, toto místo vám ukáže v rozšířené verzi) s variantou rozpoznávání - odpověď kladně nebo správně a schválit. Dále se program přesune na další složité umístění a tak dále, dokud nebude celý dokument ověřen.

Tento proces může být obecně dlouhý a nudný ...

6) Zachování

ABBYY FineReader nabízí několik možností pro uložení vaší práce. Nejčastěji se používá "přesná kopie". Tedy. celý text, text v něm bude také formátován, stejně jako ve zdrojovém kódu.Vhodná možnost pro přenos do aplikace Word. Tak jsme to udělali v tomto příkladu.

Poté uvidíte rozpoznaný text v známém dokumentu aplikace Word. Myslím, že další malovat co s tím dělat, nemá smysl ...

Na konkrétním příkladu jsme analyzovali, jak přeložit obrázek do prostého textu. Tento proces není vždy jednoduchý a rychlý.

V každém případě bude vše záviset na původní kvalitě obrazu, na vašich zkušenostech a na rychlosti počítače.

Úspěšná práce!