H5W3
当前位置:H5W3 > 其他技术问题 > 正文

fetch_20newsgroups 数据集导入失败

1、可以尝试直接从网站*( http://qwone.com/~jason/20Newsgroups/20news-bydate.tar.gz)上下载,然后在放入C:\Users\(你的user_name)\scikit_learn_data\20news_home目录下;

2、Python下载的文件叫20new-sbydate.tar.gz,自己下载的叫20newsbydate.tar.gz,所以需要改文件名字;

3、Python安装文件夹中找到文件 twenty_newsgroups.py打开;

4、

上红框是下载文件的部分, 下红框是解压文件的部分
So, 我们只需要将上红框注释掉, 并加入文件地址即可
如图:

 5、修改完成后,在执行自己写的代码,可能会出现以下错误:

EOFError: Compressed file ended before the end-of-stream marker was reached

此时再注释掉下红框的代码即可。

—————————————————————————–

注:文章参考https://segmentfault.com/a/1190000016498146,希望能帮助正在学习Python机器学习的同学。

本文地址:H5W3 » fetch_20newsgroups 数据集导入失败

评论 0

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址