更新内容:1:支持ppt下载,不过百度返回的ppt是图片,不是源文件,PPT下载后只是图片格式,不是源文件,这个真的没办法。不过如果只是把PPT下载下来播放,不需要太多修改的,用这个也就够了。2:可以支持选择文件下载路径,一起修改上去了。

明确几点:1:不能下载付费文档。 也就是需要付人民币的,都不行。2:其实说白了,就是把可以预览的word部分给整理出来,变成doc格式。3:如果word里面都是图片的。已经遇到过这种情况了,现在还不能支持。是不是图片,用鼠标在百度文库页面划拉一下就知道了,不能被选中的就是图片。

临时解决方案:原来百度文库超过50页的,是有其他逻辑的,这个要容我再看看。临时解决方案,先直接下载一次。文件改名。 然后用链接 ... x.html?from=search&pn=51 下载第二次。 ... x.html?from=search&pn=101 下载第三次,把三个doc拼在一起即可。请记得改名,因为三个文档名称相同,会覆盖的。2:word 老版本打开乱码的,请把后缀改成docx试试看。因为老版本的word是不能直接识别docx格式,需要从后缀名判断。下个版本我直接保存成docx后缀。

pdf文字版本下载后,图片示例如下:左边是百度文库的pdf预览,右边是下载后的格式

下载链接:  提取码: rg7t

为啥不用冰点文库?主要是因为冰点是先导出pdf,然后扫描出txt,文字识别有可能会错误,还有就是用word打开txt文档还是有字体,颜色等丢失,pdf本身编辑又不方便。还有就是总是要设置我的首页。。。。。特意做了这样的一个小工具,共享给大家。有很多地方还可以继续优化,可是做的非常累,给大家看看有没有人喜欢,有人喜欢的话,偶就继续再做做。偶本身不是做界面出身的,因为要给大家使用,还强行去学了一个界面,搞得丑的自己都不想要,大家克服一下吧。界面逻辑,就一个按钮,空白框里面输入百度文库地址,点击提交。文档下载到当前目录下的download文件夹里面,无论啥文件,下载号以后都叫test.doc,自己注意重命名,不然会覆盖。 还有就是偶用python做的,不知道为啥python3.7打包出来文件好大好大,要37.6MB,我也很崩溃呀,如果是我自己看到这样的大小,我也以为是病毒呀,可是确实就是这么大,这里面没有任何广告,后门 。。。。。界面后面故意留了个command窗口,是因为不会做进度条,下载时有信息都是直接输出到command窗口的。大家要是不希望回头我去学怎么做个进度条出来。。。。    当前可以做到的是:1:仅仅支持DOC格式,虽然pdf,txt格式不难,但是还没有时间去做。2:这个工具可以做到的就是doc文件格式文本下载,字体,颜色,段落基本上都是正确的。3:目前只能撷取doc文章中的文字部分,图片部分当前还没有完成,已经有思路了,技术上是可行的,回头我再想想怎么整合到代码里面去。当前实现功能1:doc格式可以下载,可以识别部分:1.1:硬回车换行,基本可以正常识别。1.2:表格中偶尔有硬回车,基本可以识别。1.3:软回车,基本可以识别2:文字应该不会有错别字,因为不是用pdf扫描识别做的。

最后放地址:版本0.01, 64位only链接:  提取码: 9zm2版本0.02, 64/32位链接: https://pan.baidu.com/s/1m1UjgoaieK13-6NnwplzgQ 提取码: gwf7 下载链接:0.9版本,64/32位链接: https://pan.baidu.com/s/1V77iTXR3N-av_pHjLvEmCA 提取码: 6uvu 0.95版本:64/32位链接: https://pan.baidu.com/s/1TKLLq9f4P93wCsoIx6iqJQ 提取码: rg7t

我只是一个搬运工