Различия
Здесь показаны различия между двумя версиями данной страницы.
Предыдущая версия справа и слева Предыдущая версия | |||
wiki:pypdf_documentation [2012/08/10 10:27] [Документация к pyPDF] |
wiki:pypdf_documentation [2012/09/18 22:21] (текущий) [Класс PageObject] |
||
---|---|---|---|
Строка 218: | Строка 218: | ||
**''extractText()''** | **''extractText()''** | ||
<колонки 80% 3%><новаяколонка> | <колонки 80% 3%><новаяколонка> | ||
- | Locate all text drawing commands, in the order they are provided in the content stream, and extract the text. This works well for some PDF files, but poorly for others, depending on the generator used. This will be refined in the future. Do not rely on the order of text coming out of this function, as it will change if this function is made more sophisticated. | + | |
+ | Найти все рисующие текст команды, в порядке их представления в потоке содержания, и извлечь текст. ((Locate all text drawing commands, in the order they are provided in the content stream, and extract the text.)) | ||
+ | Это хорошо работает для некоторых PDF, но ужасно для других, это зависит от используемого генератора. Это будет усовершенствовано в будущем. Не полагайтесь на порядок текста, исходящий от этой функции, из-за того, что он может изменится при усложнении функции. | ||
^//Возвращает:// | unicode string-объект | | ^//Возвращает:// | unicode string-объект | |