Սեպագիր ծրագրի համառոտ նկարագրությունը. OCR CuneiForm. Ծրագրի անվճար խորհուրդներ. ներբեռնեք անվճար ծրագրեր, ակնարկներ, նկարագրություններ, առաջարկություններ: Վճարովի և անվճար ծրագրեր

Այսպիսով, տեղադրում: Ubuntu-ում, ի դեպ, 0.7 տարբերակը հասանելի է պահեստներից։ 0.9 տարբերակը վերջինն է այս պահին.
wget http://launchpad.net/cuneiform-linux/0.9/cuneiform-linux-0.9/+download/cuneiform-linux-0.9.0.tar.bz2
tar xvjf սեպագիր-linux-0.9.0.tar.bz2
cd cneiform-linux-0.9.0
mkdir builddir
cd builddir
cmake -DCMAKE_BUILD_TYPE=վրիպազերծում ..
դարձնել
կատարել տեղադրել
«-DCMAKE_INSTALL_PREFIX=/your/dir» լրացուցիչ արգումենտը կտեղադրի սեպագիր ճիշտ գրացուցակում:
Դուք կարող եք այն գործարկել հետևյալ փաստարկներով.

Լ
Նշում է փաստաթղթի լեզուն: Հնարավոր է՝ eng (լռելյայն) ger fra rus swe spa ita ruseng ukr srp hrv pol dan por dut cze rum hun bul slo lav lit est tur.

Օ
Պահում է ֆայլում:

Ֆ
Ստացված տեքստի ձևաչափը. Աջակցվում է՝ տեքստ (կանխադրված), html, rtf, խելացի տեքստ (պարզ տեքստ TeX պարբերություններով), hocr (hOCR HTML ձևաչափ), բնիկ (սեպագիր 2000 ձևաչափ)

dotmatrix
Կետային մատրիցային տպիչի միջոցով տպված պատկերի սցենարի օպտիմիզացում:

Ֆաքս
Ֆաքսի միջոցով տպված պատկերի սցենարի օպտիմիզացում:

Միասյուն
Անջատում է էջի վերլուծությունը և ենթադրում է, որ մեր պատկերը բաղկացած է տեքստի մեկ սյունակից:

Օգտագործման օրինակ.
սեպագիր -l ruseng -o /our/dir/text.txt /our/dir/book_1.tif

GUI

Հաջորդը ես ուզում էի GUIկենցաղային կարիքների համար. Ընտրելու համար կա 2 կտոր՝ սա ՅԱԳՖ-ն է և.

Որոշվեց օգտվել ՅԱԳՖ-ից։ Այն նաև գրված է qt-ով և պահանջում է aspell spell checker փաթեթ: Ներբեռնեք, տեղադրեք:

Ծրագրի անվանումը OCR CuneiForm

Տարբերակ: 12

Չափը 33,4 ՄԲ

Լեզումի քանի լեզուներ ներառյալ. ռուսերեն

Ծրագրի տեսակը: տեքստի ճանաչում

Լիցենզիա: անվճար բաց կոդով

Ծրագրի նկարագրությունը

OCR CuneiForm-ը կարող է ճանաչել տպիչներից ստացված բոլոր ոճերի և տառատեսակների ցանկացած պոլիգրաֆիկ, մեքենագրված տառատեսակներ, բացառությամբ դեկորատիվ և ձեռագիր տառատեսակների: Համակարգն ունի ներկառուցված հատուկ ալգորիթմներ կետային տպիչից տեքստի ճանաչման, ֆաքսերի և մեքենագրիչների վատ լուսապատճենների համար:

OCR CuneiForm-ը հետևյալն է.

  • բարձր որակի ճանաչում;
  • աշխատանքի բարձր արագություն;
  • ռուսերեն, անգլերեն, խառը ռուսերեն-անգլերեն, ուկրաիներեն, գերմաներեն, ֆրանսերեն, իսպաներեն, իտալերեն, շվեդերեն և այլ տեքստերի ճանաչում (ընդհանուր առմամբ ավելի քան 20);
  • աշխատել ավտոմատ մասնատման ռեժիմում՝ տեքստային բլոկներ, աղյուսակներ և պատկերներ որոնելու համար, ինչպես նաև ձեռքով և կիսաավտոմատ մասնատման հզոր գործիք.
  • ցանկացած կառուցվածքի և բարդության աղյուսակների ճանաչում, ներառյալ առանց ցանցային գծերի ցուցադրման.
  • ելքային փաստաթղթում նկարազարդումների (սև և սպիտակ և գունավոր) և աղյուսակների ավտոմատ պահպանում.
  • էջի տոպոլոգիայի ամբողջական պահպանում;
  • խմբաքանակային սկանավորման և ճանաչման աջակցություն;
  • օգտագործման հեշտություն և ինտուիտիվ ինտերֆեյս, ներկառուցված օգնականներ ծրագրի հետ աշխատելու համար.
  • ներկառուցված տեքստի խմբագիրաշխատել ճանաչված տեքստի հետ;
  • պատկերների և ճանաչման արդյունքների համակցված ցուցադրում:

Համակարգն օգտագործում է մի շարք յուրահատուկ տեխնոլոգիաներներառյալ հարմարվողական ճանաչումը, նեյրոնային ցանցեր, ճանաչման այլընտրանքների ճանաչողական վերլուծություն և այլն։

Հարց ու պատասխան ծրագրի վերաբերյալ

Ի՞նչ է CuneiForm-ը: CuneiForm-ը ռուսական խոշորագույն մշակողի օպտիկական ճանաչման համակարգն է ծրագրային ապահովում Cognitive Technologies, որն ապահովում է թղթային փաստաթղթերի և էլեկտրոնային գրաֆիկական ֆայլերի արագ և որակյալ փոխակերպում, օրինակ՝ սկաներից կամ ֆաքսից, խմբագրվող տեքստի՝ տեքստային խմբագրիչներում դրա հետ հետագա աշխատանքի համար:

Ո՞ւմ համար է CuneiForm OCR-ը:Տեքստի ճանաչման CuneiForm համակարգը նախատեսված է բոլորի համար, ովքեր ստիպված են համակարգիչ մուտքագրել ֆաքսեր, գրքեր, թերթեր, մեքենագրված էջեր, պայմանագրերի տեքստեր և այլն: Համակարգի հետ աշխատելու համար բավական է սկաների մեջ տեղադրել տեքստով էջ, սեղմել կոճակը և մի քանի վայրկյանից դուք կստանաք պատրաստի արդյունքը բազմաֆունկցիոնալ տեքստային խմբագրիչում:

Ի՞նչ տառատեսակներ է ճանաչում CuneiForm OCR-ը, արդյո՞ք անհրաժեշտ է ուսուցում: CuneiForm-ը տառատեսակներից անկախ (OmniFont) համակարգ է: CuneiForm-ում ներկառուցված ալգորիթմները բխում են տառեր գրելու կանոններից, դրանց տոպոլոգիայից և չեն պահանջում որևէ ստանդարտ կամ ուսուցում։

Համակարգն օգտագործում է խելացի ինքնուսուցման տեխնոլոգիա՝ հիմնված կերպարների հարմարվողական ճանաչման վրա:

Ճանաչվում են ցանկացած տպագիր տառատեսակներ՝ գրքեր, թերթեր, ամսագրեր, տպագրություններ լազերային և մատրիցային տպիչներից, տեքստեր գրամեքենաներից և այլն:

Ձեռագիր և դեկորատիվ տառատեսակներ (գոթական, ոճավորված ձեռագիր) չեն ճանաչվում։

CuneiForm-ում կան հատուկ կարգավորումներտեքստի ճանաչման համար մատրիցային տպիչից և ֆաքսեր 200x100 dpi:

Ինչպե՞ս է CuneiForm OCR-ն տարբերվում այլ նմանատիպ ծրագրերից:

  • ճանաչման որակը;
  • աշխատանքի բարձր արագություն;
  • օգտագործելով եզակի տեխնոլոգիաներ, ինչպիսիք են հարմարվողական ճանաչումը, նեյրոնային ցանցերը, ճանաչման այլընտրանքների ճանաչողական վերլուծությունը և այլն.
  • հեշտ օգտագործման և ինտուիտիվ ինտերֆեյս;
  • ֆունկցիոնալ բովանդակություն, բազմաթիվ լրացուցիչ հնարավորությունների առկայություն:

Արդյո՞ք CuneiForm OCR-ն աջակցում է աղյուսակներին:Այո՛։ Ծրագիրը ավտոմատ կերպով տեքստում գտնում է տարբեր կառուցվածքների աղյուսակներ, այդ թվում՝ առանց տողերի: Ներկառուցված խմբագրիչը աջակցում է աղյուսակների խմբագրմանը (կարող եք փոքրացնել/մեծացնել, ջնջել/ստեղծել սյունակներ և այլն)

Ինչպե՞ս է CuneiForm OCR-ը վերաբերվում նկարներին տեքստում:Ինչպես ցանկանում եք։ Այն կարող է պարզապես անտեսել նրանց ներկայությունը, կամ այն ​​կարող է պահպանել ելքային փաստաթղթում սև ու սպիտակ, մոխրագույն կամ գունավոր՝ կախված ձեր ցանկությունից:

Ներբեռնման հղումներ

  • Ներբեռնեք տեղադրման տարբերակը depozitfiles-ից:

Տեղեկությունը վերցված է ծրագրի պաշտոնական կայքից

CuneiForm հավելվածն անվճար է, բայց հզոր գործիքսկաներից ստացված տեքստերի ճանաչման վերաբերյալ: Բացի այդ, այս ծրագիրը կարող է օպտիմալացնել ճանաչված տեքստը տարբեր ձևաչափերի համար: CuneiForm-ն առաջին հայացքից կարող է շատերին հիշեցնել նմանատիպ ծրագրեր, սակայն, այս ծրագրում կան բավական առավելություններ։ Այսպիսով, օրինակ, այստեղ իրականացվում է հսկայական քանակությամբ տպագիր արտադրանքի ճանաչման հնարավորությունը, որոնց վրա կա որևէ տեքստ։ Այն կարող է նմանվել սովորական փաստաթղթերի, ինչպես նաև տպագրել հրապարակումներ, որոնք պարունակում են մեծ թվով գրաֆիկական պատկերներ: Անգամ փաստաթղթերի անորակ պատճենները կճանաչվեն այս ծրագրի կողմից առանց խնդիրների:

Որպեսզի CuneiForm հավելվածը կարողանա ճանաչել այդքան բարձր որակով տեքստերի լայն տեսականի, այն օգտագործում է ալգորիթմներ սեփական դիզայն. Այս ծրագիրը ունի նաև ներկառուցված տեքստային խմբագրիչ, որը թույլ է տալիս խմբագրել տեքստերի լայն տեսականի առանց լրացուցիչ բաղադրիչների օգտագործման: CuneiForm ծրագրի մեկ այլ առանձնահատկություն է աղյուսակները ճանաչելու ունակությունը, և դրանց կառուցվածքը, ձևաչափը և ցուցակների կառուցման մեթոդը կարող են շատ տարբեր լինել:

Նմանատիպ այլ ծրագրերից ևս մեկ հիմնական տարբերությունը տեքստերի տարբեր մասնատման հնարավորությունն է, որը կարող է աշխատել ավտոմատ ռեժիմում, բայց նաև կիսաավտոմատ կամ մեխանիկական ռեժիմում: Նաև այս ծրագրում կա յուրօրինակ միջոց՝ ցուցադրելու ոչ միայն փաստաթղթի նախնական տարբերակը, այլև արդյունքը, որը ձևավորվում է սկանավորումն ավարտելուց հետո:

CuneiForm հավելվածը նախատեսված է բացարձակապես բոլոր օգտատերերի համար՝ շնորհիվ մշակված ինտերֆեյսի, որն առանձնանում է իր պարզությամբ, հարմարավետությամբ և ֆունկցիոնալությամբ։ Եվ այնուամենայնիվ, մնացած ամեն ինչ, դուք կարող եք անվճար ներբեռնել CuneiForm ծրագիրը, ինչը մեծացնում է բացարձակապես ցանկացած օգտվողի հետաքրքրությունը:

CuneiForm-ի առավելությունները.

  • տեքստի օպտիմիզացում տարբեր ձևաչափերով;
  • ներկառուցված տեքստային խմբագիր;
  • տարբեր աղյուսակների ճանաչում;
  • պարզ և հարմար ինտերֆեյս;
  • տեքստի ճանաչում խառը լեզուներով։

Այսպիսով, պարզվում է, որ CuneiForm հավելվածը հեշտությամբ կարող է փոխարինել ցանկացած այլ նմանատիպ ծրագիրնրանց շնորհիվ բացառիկ հնարավորություններ, ինչը, իր հերթին, կգնահատի համակարգչային դասընթացների լայն տեսականի ունեցող օգտատերերը:

Այսօր կպատմեմ և կսովորեցնեմ ճանաչել տեքստը նկարներից։ Նաև նրանց համար, ովքեր անհրաժեշտ է տեքստի ճանաչման ծրագիր, ստորև առաջարկում եմ ներբեռնել CuneiForm 12 ծրագրի ռուսերեն տարբերակը, իսկ հիմա ավելի մանրամասն կպատմեմ, թե ինչպես աշխատել դրա հետ։

Ինչու՞ պետք է ճանաչել տեքստերը:

Օրինակ, ձեզ խնդրել են ռեպորտաժ կամ շարադրություն գրել, համացանցում շրջելուց հետո դուք ոչ մի արժեքավոր բան չեք գտել։ Հետո մենք գնացինք գրադարան և գիրք վերցրեցինք զեկույցի թեմայով, բայց գրքում շատ անհրաժեշտ տեքստ կա, և նման հատոր վերատպելը կարող է քեզ ամեն ինչ տանել: ազատ ժամանակ. Սա այն է, որտեղ դա հարմար է CuneiForm 12 ծրագրակազմ, ձեզանից պահանջվում է սկանավորել ցանկալի էջերգրքեր, այնուհետև ծրագրի միջոցով նկարներից տեքստ հանելու համար: Ուզում եմ նշել, որ ամեն ինչ շատ արագ է լինում։

OCR ծրագրակազմ

Ինչպես վերևում գրեցի, մենք կաշխատենք CuneiForm 12 ծրագրի հետ: Ինչու՞ է այն ավելի լավ, քան մյուսները:

  • CuneiForm անվճար, օրինակ, ABBYY FineReader-ն արժե 3990 ռուբլի:
  • Աշխատանքի բարձր արագություն և ճանաչման որակ:
  • Տեքստերի ճանաչում 20 լեզուներով, ներառյալ խառը ռուսերեն-անգլերեն:
  • Աշխատեք նկարների և աղյուսակների հետ:
  • Օգտագործման հեշտություն և ինտուիտիվ ինտերֆեյս:
  • Ինչպես նաև բազմաթիվ տեխնիկական բարելավումներ:

Բայց կան նաև թերություններ, քանի որ սա ռուս մշակողների ծրագիր է, ապա գեղեցիկ դիզայնայն աչքի չի ընկնում, բայց ինձ համար գլխավորն այն է, որ ճիշտ ճանաչի տեքստը։

Ինչպես աշխատել CuneiForm 12-ի հետ

Ծրագիրը ներբեռնելուց և տեղադրելուց հետո գործարկեք CuneiForm 12-ը: Դուք պետք է տեսնեք հետևյալ պատուհանը.

  1. Ընտրելով նկար, որից տեքստը կճանաչվի:
  2. Տպիչի ընտրություն.
  3. Ճանաչման կոճակ:
  4. Պահպանել կոճակը:

Սեղմեք առաջին կոճակը և ընտրեք ցանկալի նկարը կամ սկանավորված էջից: Հաջորդ պատուհանում ընտրեք տեքստի լեզուն, որը դուք ունեք նկարում: Հետևյալ կարգավորումներն այնքան էլ կարևոր չեն, կարող եք ոլորել դրանց միջով։

Ճանաչումից հետո դուք պետք է տեսնեք հետևյալ պատուհանը.

Վերևում կճանաչվի ընդգծված սխալներով տեքստ, իսկ բնօրինակ պատկերի տակ: Ինչպես տեսնում եք, իմ նկարը անորակ էր, անհավասար, բայց ծրագիրը հիանալի ճանաչեց ամեն ինչ։ Ի դեպ, ինչպես տեսնում եք վերևի նկարում, ծրագիրն առաջարկում է իրադարձությունների զարգացման երեք տարբերակ.

  • Թողնել խմբագրման։
  • Պահել սկավառակի վրա:
  • Արտահանել Word կամ Excel:

Կատարված է, այժմ դուք գիտեք, թե ինչպես է դա արվում, և դուք ունեք տեքստի ճանաչման ծրագիր սկաներից: