史上最大规模1.4亿中文知识图谱开源下载

MarionMagee 发布于10天前
0 条问题

史上最大规模1.4亿中文知识图谱开源下载

知识就是力量,知识图谱是人工智能新时代的产物,简单地说知识图谱就是通过关联关系将知识组成网状的结构,然后我们的人工智能可以通过这个图谱来认识其代表的这一个现实事件,这个事件可以是现实,也可以是虚构的。

本次ownthink开源了史上最大规模的中文知识图谱,数据是以

  • 实体、属性、值

  • 实体、关系、实体

混合的形式组织,采用csv数据格式,ownthink_v2.csv下载链接见文末。

ownthink_v2.csv文件8.57G,直接读取肯定会很慢很卡。

先读取前5条数据看看样子

下面的代码是可迭代读取方式

史上最大规模1.4亿中文知识图谱开源下载

分块读取

到现在我也不知道有多少行,实在是太大了。

如果想获取某个实体的属性和值,可以使用pd.read_csv的chunksize分批读取,这里我每批次读取5条数据,总共就显示50行就结束程序

Run

数据下载方式:

关注思知机器人回复【数据下载】获取下载链接

百度网盘 https://pan.baidu.com/s/1LZjs9Dsta0yD9NH-1y0sAw 提取码: 3hpp 解压密码是:https://www.ownthink.com/

阿里云下载 https ://nebula-graph.oss-accelerate.aliyuncs.com/ownthink/kg_v2.tar.gz

近期文章

查看原文: 史上最大规模1.4亿中文知识图谱开源下载

  • blueladybug
  • goldenwolf
  • tinygoose
需要 登录 后回复方可回复, 如果你还没有账号你可以 注册 一个帐号。