Различия
Здесь показаны различия между двумя версиями данной страницы.
Предыдущая версия справа и слева Предыдущая версия Следующая версия | Предыдущая версия | ||
wiki:tesseract [2012/07/20 10:56] [Ресурсы] форматирование |
wiki:tesseract [2017/03/22 20:56] |
||
---|---|---|---|
Строка 1: | Строка 1: | ||
======== Tesseract ======== | ======== Tesseract ======== | ||
+ | ''tesseract'' - консольный OCR движок. | ||
- | ''tesseract'' - консольный OCR движок | + | ==== Описание ==== |
+ | ''Tesseract'' является качественным консольным OCR движком с открытым исходным кодом. В настоящий момент программа работает с UTF-8, поддержка языков (включая русский с версии 3.0) осуществляется с помощью дополнительных модулей. | ||
+ | |||
+ | Существуют несколько графических интерфейсов (GUI) для программы: //gImageReader, OCRFeeder, YAGF//. | ||
==== Синтаксис ==== | ==== Синтаксис ==== | ||
<code bash>tesseract imagename outbase [-l язык] [-psm N] [configfile ...]</code> | <code bash>tesseract imagename outbase [-l язык] [-psm N] [configfile ...]</code> | ||
- | ==== Описание ==== | ||
- | |||
- | ''tesseract(1)'' является качественным коммерческим OCR движком, оригинально разработанным HP между 1985 и 1995. В 1995, этот движок был в топ-3 по оценке UNLV. Исходные тексты были открыты HP и UNLV в 2005-м, и с тех пор дорабатываются Google. | ||
- | ((''tesseract(1)'' is a commercial quality OCR engine originally developed at HP between 1985 and 1995. In 1995, this engine was among the top 3 evaluated by UNLV. It was open-sourced by HP and UNLV in 2005, and has been developed at Google since then.)) | ||
==== Опции ==== | ==== Опции ==== | ||
<code bash>imagename</code> | <code bash>imagename</code> | ||
Строка 102: | Строка 102: | ||
==== История ==== | ==== История ==== | ||
+ | ''Tesseract'' был разработан компанией HP между 1985 и 1995, а затем десять лет не изменялся. В 2005 году были открыты исходные тексты. С 2006 года разработку движка спонсирует компания Google. | ||
+ | |||
The engine was developed at Hewlett Packard Laboratories Bristol and at | The engine was developed at Hewlett Packard Laboratories Bristol and at | ||
Hewlett Packard Co, Greeley Colorado between 1985 and 1994, with some | Hewlett Packard Co, Greeley Colorado between 1985 and 1994, with some | ||
Строка 133: | Строка 135: | ||
==== Ресурсы ==== | ==== Ресурсы ==== | ||
- | * Main web site: http://code.google.com/p/tesseract-ocr/ | + | * Сайт проекта: https://github.com/tesseract-ocr |
- | * Information on training: http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3 | + | * Документация: https://github.com/tesseract-ocr/tesseract/wiki |
+ | * Википедия: https://ru.wikipedia.org/wiki/Tesseract | ||
==== Смотрите также ==== | ==== Смотрите также ==== | ||
ambiguous_words(1), cntraining(1), combine_tessdata(1), | ambiguous_words(1), cntraining(1), combine_tessdata(1), | ||
Строка 152: | Строка 154: | ||
Samuel Charron, Sheelagh Lloyd, Shobhit Saxena, and Thomas Kielbus. | Samuel Charron, Sheelagh Lloyd, Shobhit Saxena, and Thomas Kielbus. | ||
- | ==== COPYING ==== | + | ==== Копирование ==== |
- | Licensed under the Apache License, Version 2.0 | + | |
+ | Зарегистрирован под лицензией //Apache License, Version 2.0// | ||
{{tag>tesseract}} | {{tag>tesseract}} |