Различия
Здесь показаны различия между двумя версиями данной страницы.
Предыдущая версия справа и слева Предыдущая версия Следующая версия | Предыдущая версия | ||
wiki:pypdf_documentation [2012/08/10 10:27] [Документация к pyPDF (в процессе перевода на русский)] |
wiki:pypdf_documentation [2012/09/18 22:21] (текущий) [Класс PageObject] |
||
---|---|---|---|
Строка 1: | Строка 1: | ||
====== Документация к pyPDF ====== | ====== Документация к pyPDF ====== | ||
- | <note warning>Это любительский перевод документации. Не стоит относится к нему со 100%-ной уверенностью.</note> | + | <note warning>Это любительский перевод документации. Не стоит относится к нему со 100%-ным доверием.</note> |
<note important>Много оригинальных английских предложений есть в сносках (активируются при наведении.)</note> | <note important>Много оригинальных английских предложений есть в сносках (активируются при наведении.)</note> | ||
Строка 218: | Строка 218: | ||
**''extractText()''** | **''extractText()''** | ||
<колонки 80% 3%><новаяколонка> | <колонки 80% 3%><новаяколонка> | ||
- | Locate all text drawing commands, in the order they are provided in the content stream, and extract the text. This works well for some PDF files, but poorly for others, depending on the generator used. This will be refined in the future. Do not rely on the order of text coming out of this function, as it will change if this function is made more sophisticated. | + | |
+ | Найти все рисующие текст команды, в порядке их представления в потоке содержания, и извлечь текст. ((Locate all text drawing commands, in the order they are provided in the content stream, and extract the text.)) | ||
+ | Это хорошо работает для некоторых PDF, но ужасно для других, это зависит от используемого генератора. Это будет усовершенствовано в будущем. Не полагайтесь на порядок текста, исходящий от этой функции, из-за того, что он может изменится при усложнении функции. | ||
^//Возвращает:// | unicode string-объект | | ^//Возвращает:// | unicode string-объект | |