在做数据采集时,因目标网站使用防盗链技术导致图片无法显示,这种情况就需要把图片下载下来,并把图片上传到对应的OSS或网站的本地目录中。这里列举了在使用简数采集平台时对图片处理与配置中常见的问题及解决方法,更好地帮助大家快速使用简数采集。问题现象及解决方法如下:

1.图片存储到阿里云oss不显示问题

  直接复制图片地址访问,出现

解决:在阿里云对象管理中,选择你自己的bucket–》基础设置–》读写权限–》设置–》公共读

2.如何删除暂存简数的图片?

  图片暂存在简数有存储空间限制,如果满了就需要删除掉图片,腾出空间才能采集新的图片;

删除单个任务里的图片:进入某个任务的【结果数据&发布】栏目 》 点击【更多操作】按钮 》 在下拉列表中点击【清空本任务图片】;

3. 图片暂存简数,设置发布后自动删除图片方法

  图片暂存简数,设置发布成功后自动删除对应的数据和图片方法

  I、自动发布删除图片

  在自动发布设置页面,选择【删除数据及暂存简数图片】,保存;

  II、手动发布删除图片

  在手动发布设置页面,选择【删除数据及暂存简数图片】,发布;

4. 图片暂存简数,发布后图片在discuz无法显示?

discuz的暂存简数图片设置,需改为绝对地址(例:http://www.xxxxxx.com/uc_server/data/attachment/forum),再重新采集发布。

5. 如何采集到图片?

  图片在网页里是HTML代码的img标签,所以要想采集到图片,这个字段首先得设置【获取Html】,才会保留HTML标签;

文章来源于互联网,如有雷同请联系站长删除:数据采集中图片下载设置常见问题及解决方法

发表评论