如何使用 xpdf 从 PDF 中提取文本?
我的一个文件夹中有很多 PDF 文件。我想使用 xpdf 从这些 PDF 中提取文本。例如:
- example1.pdf 提取到 example1.txt
- example2.pdf 提取到 example2.txt
- 等等。
这是我的代码:
<?php
$path = 'C:/AppServ/www/pdfs/';
$dir = opendir($path);
$f = readdir($dir);
while ($f = readdir($dir)) {
if (eregi("\.pdf",$f)){
$content = shell_exec('C:/AppServ/www/pdfs/pdftotext '.$f.' ');
$read = strtok ($f,".");
$testfile = "$read.txt";
$file = fopen($testfile,"r");
if (filesize($testfile)==0){}
else{
$text = fread($file,filesize($testfile));
fclose($file);
echo "</br>"; echo "</br>";
}
}
}
我得到空白结果。我的代码有什么问题吗?
I have many PDFs in a folder. I want to extract the text from these PDFs using xpdf. For example :
- example1.pdf extract to example1.txt
- example2.pdf extract to example2.txt
- etc..
here is my code :
<?php
$path = 'C:/AppServ/www/pdfs/';
$dir = opendir($path);
$f = readdir($dir);
while ($f = readdir($dir)) {
if (eregi("\.pdf",$f)){
$content = shell_exec('C:/AppServ/www/pdfs/pdftotext '.$f.' ');
$read = strtok ($f,".");
$testfile = "$read.txt";
$file = fopen($testfile,"r");
if (filesize($testfile)==0){}
else{
$text = fread($file,filesize($testfile));
fclose($file);
echo "</br>"; echo "</br>";
}
}
}
I get blank result. What's wrong with my code?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
尝试使用这个:
try using this :
您不必创建临时 txt 文件,检查服务器的错误日志。
如果不起作用,
You do not have to create a temporary txt file
if it does not work check the error logs of the server.
这些行
应该是
希望这有帮助
The lines
should be
Hope this helps