百度文档是一款由网友开发制作的百度文库资源下载工具,可以直接从百度文库中下载doc、ppt等格式的文件,摆脱需要下载币的麻烦,需要的用户快来下载吧!
百度文档是一款百度文库资源下载工具,目前暂时只支持doc、ppt文件下载,可以撷取doc文章中的文字部分,PPT下载后只是图片格式。
当前可以做到的是:
1:仅仅支持DOC格式,虽然pdf,txt格式不难,但是还没有时间去做。
2:这个工具可以做到的就是doc文件格式文本下载,字体,颜色,段落基本上都是正确的。
3:目前只能撷取doc文章中的文字部分,图片部分当前还没有完成,已经有思路了,技术上是可行的,回头我再想想怎么整合到代码里面去。
当前实现功能
1:doc格式可以下载,可以识别部分:
1.1:硬回车换行,基本可以正常识别。
1.2:表格中偶尔有硬回车,基本可以识别。
1.3:软回车,基本可以识别
2:文字应该不会有错别字,因为不是用pdf扫描识别做的。
更新到版本0.95
主要更新内容:
1:支持ppt下载,不过百度返回的ppt是图片,不是源文件,PPT下载后只是图片格式,不是源文件,这个真的没办法。不过如果只是把PPT下载下来播放,不需要太多修改的,用这个也就够了。
2:大家提出意见希望可以支持选择文件下载路径,一起修改上去了。