ocr后不能生成txttxt转epub格式转换器

如何将zip格式的电子书转换为txt格式
09-06-07 &匿名提问 发布
PDF是电子图书常用的文件格式,但是由于PDF文件不便阅读(需要安装Acrobat才能看),而且少则几百K,多则十来兆,不便网上传输,我们常常希望能把它转化成文本文件格式,却又往往无从下手。其实,这并不是一件难事。 首先,我要向大家介绍一个能将PDF文件转成TXT文件的软件——Aerial2.0。(not compatible with Acrobat 5). 我们知道,阅读PDF文件的工具,当属Adobe的Acrobat reader软件了,而Aerial则是Acrobat的一个插件。在安装了Aerial之后,Acrobat reader的菜单中的“plug-ins“就会多出一项“Aerial“。 Aerial 2.0为我们浏览PDF文件提供了强大的功能: 1.index manager:用于查找和管理文章的索引(必须要有Acrobat Exchange); 2.navigator: 为PDF文件建立树结构,方便我们浏览; 3.paper clip page:剪贴页管理(必须要有Acrobat Exchange); 4.copy table to clipboard:将表格复制到剪贴板; 5.save as RTF :这才是我们最需要的功能,转化之后不仅保留了文字,连字体和颜色图案都能保留下来! 但是,Aerial并不是万能的,它对中文支持不太好,排版有时会比较混乱,而且遇上扫描的纯图形的PDF文件时就无能为力了。要想把此类PDF文件转化成文本文件,就相对麻烦一些了,具体步骤如下: 1.先用Acrobat打开PDF文件,选定区域,放大到300% 500%(视具体情况而定), 复制到剪贴板。 2.用Photoshop或Photoimpact等图形软件调出剪贴板的图形,存成单色的(注意:一定要单色)TIF、PCX或BMP文件,图形文件格式视你所用的OCR软件而定。笔者推荐使用BMP文件存盘。 3.用OCR软件识别图形文件(笔者用的是Wtocr7.0),经过简单的排版校正后,一般能有95%以上的识别率。再经过你的手工修改后,就可以了。 以上是笔者在实际过程中的一些经验,希望能对朋友们有所启发。Aerial 可以到下载。或者点此下载。 想把PDF文件转换成文本方式的工具也很多。比如在Acrobat 5.0中,我们可以快速地将Adobe PDF文件另存为RTF文件,或者TIFF、JPEG、PNG格式的图像文件。Acrobat可将Adobe PDF文件的每个页面转换成单个的图像文件,图像格式视所选而定;利用PDF2HTM也可以将PDF文件变为HTML文件,而且完全支持中英文PDF文档的转换,对PDF的版面信息可以完全保留,生成HTML的效果基本与原版的PDF一致,简单排版后即可输出。如果你对其中的插图不感兴趣,还可以用PDF2TXT。下面我们一起来看看下PDF2HTM和PDF2TXT的用法。 ★PDF2HTM★ 从处下载的PDF2HTM文件不过106KB,其中包括一个文本文件README.TXT和一个程序文件PDF2HTM.EXE。这是一个基于DOS环境的程序文件,由魔镜软件工作室独立开发。 它的用法很简单。进入MSDOS方式,转到程序所在目录,假设要转换的PDF文件也在同一目录,文件名为demo.pdf,在DOS命令提示符下输入“PDF2HTM demo.pdf”即可。再dir一下或者回到Windows资源管理器下看看,增加了些什么文件? ★PDF2TXT★ 从处下载的pdf2txtv2.0.zip是508KB,内含两个文件:GZIP.dll和pdf2txt.exe。我们只需把它们解压到同一目录即可。
请登录后再发表评论!使用汉王pdf ocr转txt文件,为什么等几分钟后生成的文本文件打开无内容呢?_百度知道
使用汉王pdf ocr转txt文件,为什么等几分钟后生成的文本文件打开无内容呢?
提问者采纳
估计你是直接点pdf转txt文件了。应该是先选择全部,再点“识别”
提问者评价
是直接点的。如果拆分,整本书数百页,一页一个文件,如何处理,有无简捷的办法?
其他类似问题
按默认排序
其他3条回答
无法识别呗~~~汉王的技术~~~哎~~~
试试其他的OCR技术吧~~
没事别出来ocr本来就是智能识别 读不出来很正常
你转的这个肯定是受版权保护的不允许转。 由于pdf是保护性格式,转txt很不稳定,同理转doc一样不稳定。但是由其他格式转pdf很简单稳定。
txt文件的相关知识
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁如何把png格式的文档转换成txt格式的??已下载过“汉王PDF OCR&可是还是没成功····急用_百度知道
如何把png格式的文档转换成txt格式的??已下载过“汉王PDF OCR&可是还是没成功····急用
提问者采纳
而txt是电子书的格式不可能转过来,因为png是图片格式,最多就是改后辍名
采纳率100%
其他类似问题
按默认排序
其他1条回答
这就需要你自己去校对,看到先说怎么弄吧,选出你要识别区域的文字.(软件上有提示.打开后,你在抄书时,是两种不同的类型的存在,不用细说)LZ你好,最好可以保证清晰度够高,后面的你一看就懂,无法直接转换汉王是个图形文档的识别软件,打开汉王,这是图片.图片与文字,要把书上的字,打个比喻,导入你的PNG格式的图片(必须明确一点,就是识别时会有误差,看上面的选项,不是文字.既然是这样.确定即可,这个软件就是实现这个功能的,推荐做成白底黑字,现在来更正一下你的理解,这是两个不同的概念),没有其它的办法,这样有利于软件识别,png的图片,就会存在一个问题,再用手写出来
png格式的相关知识
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁怎么把扫描文件转换成txt格式_百度知道
怎么把扫描文件转换成txt格式
急,手机只支持TXT格式怎么办。急我把文件扫描了但是要存在手机里
提问者采纳
直接复制就可以了如果是文本式的PDF:点照相---选文本---点右键选文字识别---再在文字识别里复制粘贴就行了 有的议论文格式出现的pdf格式可以直接复制
这类软件使用过不下10几种,最终还是觉得一个小软件最好。这种情况下不加密你也不能复制和转换的。 如果是图片式的:Gemini。
对pdf格式的文件文字的复制方法,需要用到OCR原理的软件
其他类似问题
扫描文件的相关知识
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁}

我要回帖

更多关于 kindle支持txt格式吗 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信