当前位置: 首页 > news >正文

淮安网站定制内蒙古做网站公司

淮安网站定制,内蒙古做网站公司,中国建设银行u盾下载假网站吗,wordpress中链接显示不对题🥰大家知道吗,之前在给AI大模型"喂数据"的时候,我们往往需要把非结构化数据(比如PDF、PPT、Excel等)自己手动转成结构化的格式,这可真是太累人儿了。🥵 幸好现在有了Unstructured这个神级库,它内置的数据提取函数可以帮我们快速高效地完成这个…

🥰大家知道吗,之前在给AI大模型"喂数据"的时候,我们往往需要把非结构化数据(比如PDF、PPT、Excel等)自己手动转成结构化的格式,这可真是太累人儿了。🥵

幸好现在有了Unstructured这个神级库,它内置的数据提取函数可以帮我们快速高效地完成这个转换过程。而且支持常见的多种文件格式!🐶

比如说,如果我们要从一个PPT文件里提取数据,可以用partition_pptx函数:

from unstructured.partition.pptx import partition_pptxfilename = "example_files/msft_openai.pptx"
elements = partition_pptx(filename=filename)

这个函数会把PPT文件的内容解析成一个elements列表,每个元素都是一个Element对象,分别代表PPT里的标题、文字、图片等内容。

但是我们想要的是结构化数据而不是对象呀,所以还需要再转换一下:

element_dict = [el.to_dict() for el in elements]
print(json.dumps(element_dict, indent=2))

这两行代码的作用是:

  1. 遍历elements列表,把每个Element对象都转换成字典(调用它们的to_dict方法)
  2. 把这些字典组成一个新列表element_dict
  3. 使用json.dumpselement_dict转成Json格式的字符串,并指定indent=2让结果更加美观

是不是很酷?现在我们就拥有了结构化的数据啦!

如果是PDF文件的话,流程也差不多:

from unstructured.shared import Files, PartitionParameters
from unstructured.openai_api import SDKfilename = "example_files/CoT.pdf"
with open(filename, "rb") as f:files = Files(content=f.read(), file_name=filename)req = PartitionParameters(files=files, strategy='hi_res', pdf_infer_table_structure=True)s = SDK.get_instance() 
resp = s.general.partition(req)
print(json.dumps(resp.elements, indent=2))

这里主要新的地方是用Files对象来存PDF文件的内容,然后定义一个PartitionParameters来设置处理策略(比如识别表格等)。

最后就是创建SDK实例,调用partition方法,传入之前定义的参数,就能获取PDF里的结构化数据啦!

对于Excel文件,官方文档里也有介绍,应该也是类似的操作。

有了这些技能,我们就能把海量的非结构化数据高效地转换成结构化格式,喂给大模型"吃"啦!以后制作AI应用的时候,效率和开发体验都会更上一层楼~🚀

http://www.yayakq.cn/news/413076/

相关文章:

  • 西宁网站公司国外网站 网速慢
  • 如何进行电商营销推广珠海seo关键词排名
  • 宁波网站建设排名wordpress企业魔板
  • 洛阳网站开发培训i深圳谁开发的
  • 博客网站哪个权重高平面设计自学网站有哪些
  • 更换网站需要怎么做装修网站vr全景图怎么做
  • 前端开发做移动端的网站畔游网站建设
  • 网站界面设计教程网站的ico怎么做
  • 网站建设参考网站的说明书服务器内部打不开网站
  • 动画做a视频在线观看网站西宁网站建设哪家强
  • 做网站下面会有小广告江阴市住房与建设局网站
  • 餐饮网站建设有什么好处资源网站排名优化seo
  • php mysql网站后台源码全屋定制营销
  • 重庆九龙坡区哪里有做网站的怎么做网站网站的代理
  • 北京网站建设培训机构温州网站升级
  • wap网站怎么做安装2个wordpress
  • 如何建设网站网站网站被降权恢复
  • 网站建立步骤wordpress 小工具代码
  • 电商网站建设实训(互联网营销大赛)天河建设网站方案
  • 宣武门网站建设wordpress全文检索
  • php搭建一个简单的网站天猫网站建设的目标是什么意思
  • 沈阳网站seo排名网站维护细则
  • 四川省微信网站建设公哈尔滨营销网站建设公司哪家好
  • 有关网站建设的视频百度地图怎么没有实景导航了
  • 做网站需提供什么资料wordpress4.9怎么安装
  • 免费做网站的软件晋中住房与城乡建设厅网站
  • 专业公司网站设计企业黑龙江新闻法治频道节目回放
  • 老字号品牌建设石家庄seo顾问
  • 高端网站设计新鸿儒深圳市响应式网站建设
  • 怎样建立自己的个人网站石家庄网站建设seo公司