终于有了！大规模中文NLP语料库！-电子发烧友网

本文介绍一个中文自然语言处理语料库项目：nlp_chinese_corpus ，初步贡献了几个已经预处理好的中文语料，包括维基、新闻和百科语料，可直接下载使用。

众所周知，中文NLP领域缺乏高质量的中文语料。作者徐亮（实在智能算法专家) 创建了一个中文自然语言处理语料库项目：nlp_chinese_corpus ，初步贡献了几个已经预处理好的中文语料，包括维基、新闻和百科语料。

大规模中文自然语言处理语料 Large Scale Chinese Corpus for NLP

https://github.com/brightmart/nlp_chinese_corpus

为中文自然语言处理领域发展贡献语料

贡献中文语料，请联系:nlp_chinese_corpus@163.com

语料库将会不断扩充。。。

一期目标：10个百万级中文语料 & 3个千万级中文语料(2019年5月1号)

二期目标：30个百万级中文语料 & 10个千万级中文语料 & 1个亿级中文语料（2019年12月31日）

为什么需要这个项目

中文的信息无处不在，但如果想要获得大量的中文语料，却是不太容易，有时甚至非常困难。在2019年初这个时点上，

普通的从业者、研究人员或学生，并没有一个比较好的渠道获得极大量的中文语料。笔者想要训练一个中文的词向量，

在百度和github上上搜索了好久，收获却很少：要么语料的量级太小，要么数据过于成旧，或需要的处理太复杂。

不知道你是否也遇到了这样的问题？

我们这个项目，就是为了解决这一问题贡献微薄之力。

维基百科(wiki2019zh) ---- 新闻语料(news2016zh) ---- 百科问答(baike2018qa)

1. 维基百科json版(wiki2019zh)

104万个词条(1,043,224条; 原始文件大小1.6G，压缩文件519M；数据更新时间：2019.2.7)

点此下载：https://pan.baidu.com/s/1uPMlIY3vhusdnhAge318TA

可能的用途：

可以做为通用中文语料，做预训练的语料或构建词向量，也可以用于构建知识问答。

结构：

{"id":,"url":,"title":,"<a href="//www.obk20.com/tags/te/" target="_blank"><u>te</u></a>xt":<text>} 其中，title是词条的标题，text是正文；通过" "换行。</p> <p style="text-indent: 2em;"> 例子：</p> <p style="text-indent: 2em;"> {"id": "53", "url": "https://zh.wikipedia.org/wiki?curid=53", "title": "经济学", "text": "经济学经济学是一门对<a href="https://www.hqchip.com/ask/" target="_blank"><u>产品</u></a>和服务的生产、分配以及消费进行研究的社会科学。西方语言中的“经济学”一词源于古希腊的。经济学注重的是研究经济行为者在一个经济体系下的行为，以及他们彼此之间的互动。在现代，经济学的教材通常将这门领域的研究分为总体经济学和个体经济学。微观经济学检视一个社会里基本层次的行为，包括个体的行为者（例如个人、<a href="https://m.hqchip.com/gongsi.html" target="_blank"><u>公司</u></a>、买家或卖家）以及与市场的互动。而宏观经济学则分析整个经济体和其议题，包括失业、通货膨胀、经济成长、财政和货币政策等。..."}</p> <p style="text-indent: 2em;"> 效果：</p> <p style="text-indent: 2em;"> 经济学经济学是一门对产品和服务的生产、分配以及消费进行研究的社会科学。西方语言中的“经济学”一词源于古希腊的。经济学注重的是研究经济行为者在一个经济体系下的行为，以及他们彼此之间的互动。在现代，经济学的教材通常将这门领域的研究分为总体经济学和个体经济学。微观经济学检视一个社会里基本层次的行为，包括个体的行为者（例如个人、公司、买家或卖家）以及与市场的互动。而宏观经济学则分析整个经济体和其议题，包括失业、通货膨胀、经济成长、财政和货币政策等。其他的对照还包括了实证经济学（研究「是什么」）以及规范经济学（研究「应该是什么」）、经济理论与实用经济学、行为经济学与理性选择经济学、主流经济学（研究理性-个体-均衡等）与非主流经济学（研究体制-历史-社会结构等）。经济学的分析也被用在其他各种领域上，主要领域包括了商业、金融、和政府等，但同时也包括了如健康、犯罪、教育、法律、政治、社会架构、宗教、战争、和科学等等。到了21世纪初，经济学在社会科学领域各方面不断扩张影响力，使得有些学者讽刺地称其为「经济学帝国主义」。在现代对于经济学的定义有数种说法，其中有许多说法因为发展自不同的领域或理论而有截然不同的定义，苏格兰哲学家和经济学家亚当·斯密在1776年将政治经济学定义为「国民财富的性质和原因的研究」，他说：让-巴蒂斯特·赛伊在1803年将经济学从公共政策里独立出来，并定义其为对于财富之生产、分配、和消费的学问。另一方面，托马斯·卡莱尔则讽刺的称经济学为「忧郁的科学」（Dismal science），不过这一词最早是由马尔萨斯在1798年提出。约翰·斯图尔特·密尔在1844年提出了一个以社会科学定义经济学的角度： .....</p> <p align="center"> <img src="http://file.elecfans.com/web1/M00/85/48/pIYBAFxkvAeAPBXsAAF3JcDrujk932.png" /></p> <p style="text-indent: 2em;"> 2. 新闻语料json版(news2016zh)</p> <p style="text-indent: 2em;"> 250万篇新闻( 原始数据9G，压缩文件3.6G；新闻内容跨度：2014-2016年)</p> <p style="text-indent: 2em;"> 点此下载：https://pan.baidu.com/share/init?surl=LJeq1dkA0wmYd9ZGZw72Xg 密码: film</p> <p style="text-indent: 2em;"> 数据描述</p> <p style="text-indent: 2em;"> 包含了250万篇新闻。新闻来源涵盖了6.3万个媒体，含标题、关键词、描述、正文。</p> <p style="text-indent: 2em;"> 数据集划分：数据去重并分成三个部分。训练集：243万；验证集：7.7万；测试集，数万，不提供下载。</p> <p style="text-indent: 2em;"> 可能的用途：</p> <p style="text-indent: 2em;"> 可以做为【通用中文语料】，训练【词向量】或做为【预训练】的语料；也可以用于训练【标题生成】模型，或训练【关键词生成】模型（选关键词内容不同于标题的数据）；亦可以通过新闻渠道区分出新闻的类型。</p> <p style="text-indent: 2em;"> 结构：</p> <p style="text-indent: 2em;"> {'news_id': <news_id>,'title':<title>,'content':<content>,'source': <source>,'time':<time>,'keywords': <keywords>,'desc': <desc>, 'desc': <desc>} 其中，title是新闻标题，content是正文，keywords是关键词，desc是描述，source是新闻的来源，time是发布时间</p> <p style="text-indent: 2em;"> 例子：</p> <p style="text-indent: 2em;"> {"news_id": "610130831", "keywords": "导游，门票","title": "故宫淡季门票40元 “黑导游”卖外地客140元", "desc": "近日有网友微博爆料称，故宫午门广场售票处出现“黑导游”，专门向外地游客出售高价门票。昨日，记者实地探访故宫，发现“黑导游”确实存在。窗口出售", "source": "新华网", "time": "03-22 12:00", "content": "近日有网友微博爆料称，故宫午门广场售票处出现“黑导游”，专门向外地游客出售高价门票。昨日，记者实地探访故宫，发现“黑导游”确实存在。窗口出售40元的门票，被“黑导游”加价出售，最高加到140元。故宫方面表示，请游客务必通过正规渠道购买门票，避免上当受骗遭受损失。目前单笔门票购买流程不过几秒钟，耐心排队购票也不会等待太长时间。....再反弹”的态势，打击黑导游需要游客配合，通过正规渠道购买门票。"}</p> <p align="center"> <img src="http://file.elecfans.com/web1/M00/85/48/pIYBAFxkvAiAfmmpAACE8Ma8IUU919.png" /></p> <p style="text-indent: 2em;"> 3.百科类问答json版(baike2018qa)</p> <p style="text-indent: 2em;"> 150万个问答( 原始数据1G多，压缩文件663M；数据更新时间：2018年)</p> <p style="text-indent: 2em;"> 点此下载：https://pan.baidu.com/s/12TCEwC_Q3He65HtPKN17cA 密码:fu45</p> <p style="text-indent: 2em;"> 数据描述</p> <p style="text-indent: 2em;"> 含有150万个问题和答案，每个问题属于一个类别。总共有492个类别，其中频率达到或超过10次的类别有434个。</p> <p style="text-indent: 2em;"> 数据集划分：数据去重并分成三个部分。训练集：142.5万；验证集：4.5万；测试集，数万，不提供下载。</p> <p style="text-indent: 2em;"> 可能的用途：</p> <p style="text-indent: 2em;"> 可以做为通用中文语料，训练词向量或做为预训练的语料；也可以用于构建百科类问答；其中类别信息比较有用，可以用于做监督训练，从而构建更好句子表示的模型、句子相似性任务等。</p> <p style="text-indent: 2em;"> 结构：</p> <p style="text-indent: 2em;"> {"qid":<qid>,"category":<category>,"title":<title>,"desc":<desc>,"answer":<answer>} 其中，category是问题的类型，title是问题的标题，desc是问题的描述，可以为空或与标题内容一致。</p> <p style="text-indent: 2em;"> 例子：</p> <p style="text-indent: 2em;"> {"qid": "qid_2540946131115409959", "category": "生活知识", "title": "冬天进补好一些呢，还是夏天进步好啊？ ", "desc": "", "answer": "你好！当然是冬天进补好的了，夏天人体的胃处于收缩状态，不适宜大量的进补，所以我们有时候说：“夏天就要吃些清淡的，就是这个道理的。” 不过，秋季进补要注意“四忌” 一忌多多益善。任何补药服用过量都有害。认为“多吃补药，有病治病，无病强身”是不的。过量进补会加重脾胃、肝脏负担。在夏季里，人们由于喝冷饮，常食冻品，多有脾胃功能减弱的现象，这时候如果突然大量进补，会骤然加重脾胃及肝脏的负担，使长期处于疲弱的消化器官难于承受，导致消化器官功能紊乱。二忌以药代食。重药物轻食物的做法是不科学的，许多食物也是好的滋补品。如多吃荠菜可治疗高血压；多吃萝卜可健胃消食，顺气宽胸；多吃山药能补脾胃。日常食用的胡桃、芝麻、花生、红枣、扁豆等也是进补的佳品。三忌越贵越好。每个人的身体状况不同，因此与之相适应的补品也是不同的。价格昂贵的补品如燕窝、人参之类并非对每个人都适合。每种进补品都有一定的对象和适应症，应以实用有效为滋补原则，缺啥补啥。四忌只补肉类。秋季适当食用牛羊肉进补效果好。但经过夏季后，由于脾胃尚未完全恢复到正常功能，因此过于油腻的食品不易消化吸收。另外，体内过多的脂类、糖类等物质堆积可能诱发心脑血管病。"}</p> <p align="center"> <img src="http://file.elecfans.com/web1/M00/85/48/pIYBAFxkvAmASea5AAC8CFmF0pY642.png" /></p> <p style="text-indent: 2em;"> 公开评测：</p> <p style="text-indent: 2em;"> 欢迎报告模型在验证集上的准确率。任务1：类别预测。</p> <p style="text-indent: 2em;"> 报告包括：#1）验证集上准确率；#2）采用的模型、方法描述、运行方式，1页PDF；#3）可运行的源代码(可选)</p> <p style="text-indent: 2em;"> 基于#2和#3，我们会在测试集上做测试，并报告测试集上的准确率；只提供了#1和#2的队伍，验证集上的成绩依然可以被显示出来，但会被标记为未验证。</p> <p style="text-indent: 2em;"> 贡献语料/Contribution</p> <p style="text-indent: 2em;"> 贡献中文语料，请发送邮件至nlp_chinese_corpus@163.com</p> <p style="text-indent: 2em;"> 为了共同建立一个大规模开放共享的中文语料库，以促进中文自然语言处理领域的发展，凡提供语料并被采纳到该项目中，</p> <p style="text-indent: 2em;"> 除了会列出贡献者名单（可选）外，我们会根据语料的质量和量级，选出前20个同学，结合您的意愿，寄出键盘、鼠标、</p> <p style="text-indent: 2em;"> 显示屏、无线耳机、<a href="//www.obk20.com/tags/智能音箱/" target="_blank"><u>智能音箱</u></a>或其他等值的物品，以表示对贡献者的感谢。</p> <p style="text-indent: 2em;"> <a href="//www.obk20.com/bbs/zhuti_1472_1.html" target="_blank"><u>ad</u></a>d your chinese corpus here by sending us an email</p> <p style="text-indent: 2em;"> if there is any issue regarding the data, you <a href="https://www.hqchip.com/app/2004" target="_blank"><u>can</u></a> also cont<a href="https://m.hqchip.com/app/1703" target="_blank"><u>ac</u></a>t with us, we will process it. thank you for your unde<a href="//www.obk20.com/tags/rs/" target="_blank"><u>rs</u></a>tanding.</p> <p style="text-indent: 2em;"> Reference</p> <p style="text-indent: 2em;"> 利用<a href="//www.obk20.com/tags/python/" target="_blank"><u>Python</u></a>构建Wiki中文语料词向量模型试验</p> <p style="text-indent: 2em;"> A tool for extracting plain text from Wikipedia du<a href="//www.obk20.com/tags/mps/" target="_blank"><u>mps</u></a></p> <p style="text-indent: 2em;"> Open Chinese convert (OpenCC) in pure Python:開放中文轉換</p> <p style="text-indent: 2em;"> dumps of wiki, latest in chinese</p> </div> <div class="statement2"> 声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。 <a class="complaint handleJumpBy" href="//www.obk20.com/about/tousu.html" target="_blank">举报投诉</a> </div> <ul class="hot-main clearfix" style="text-align: right; "> <li data-href="//www.obk20.com/tags/自然语言处理/"> <span>自然语言处理</span> <div class="hot-des"> <div class="detail"> <div class="top clearfix"> <div class="lf title"> <a href="//www.obk20.com/tags/自然语言处理" target="_blank">自然语言处理</a> </div> <div class="lf attend advertTagId" data-id="149713">+关注</div> </div> <div id="tag_desc_button149713"></div> <div class="clearfix des-detail"> <div class="lf"> <p>关注</p> <span>1</span> </div> <div class="lf"> <p>文章</p> <span>618</span> </div> <div class="lf"> <p>浏览量</p> <span>13554</span> </div> </div> </div> </div> </li><li data-href="//www.obk20.com/tags/nlp/"> <span>nlp</span> <div class="hot-des"> <div class="detail"> <div class="top clearfix"> <div class="lf title"> <a href="//www.obk20.com/tags/nlp" target="_blank">nlp</a> </div> <div class="lf attend advertTagId" data-id="169604">+关注</div> </div> <div id="tag_desc_button169604"></div> <div class="clearfix des-detail"> <div class="lf"> <p>关注</p> <span>1</span> </div> <div class="lf"> <p>文章</p> <span>488</span> </div> <div class="lf"> <p>浏览量</p> <span>22034</span> </div> </div> </div> </div> </li> </ul>  <div class="articleContentFooterAD" style="display: none; margin: 20px 0 0 0;"></div> <div class="wx_detail"> <p>原文标题：中文NLP福利！大规模中文自然语言处理语料</p> <p>文章出处：【微信号：AI_era，微信公众号：新智元】欢迎添加关注！文章转载请注明出处。</p> </div> </div> <div class="art-share-layout mt18" id="shareAddPcb"> <div class="clearfix"> <a href="javascript:;" class="art-collect J_bottom-coll J_coll-btn" style="visibility:visible">收藏</a> <span class="ml15 fb"><span class="J_stownum"></span>人收藏</span> <div class="bdsharebuttonbox fr"> <div class="share-web-qrcode--detail fl"> <i class="share-web-qrcode--share-icon"></i> <div class="share-web-qrcode--bubble"> <div class="share-web-qrcode--bubble-inner"> <p class="qrcode-copy-title">扫一扫，分享给好友</p> <div class="qrcode-image"></div> <div class="qrcode-copy-link"><span>复制链接分享</span></div> </div> </div> </div> </div> </div> <a class="art-like-up J_bottom-like J_like-btn" href="javascript:;"></a> <ul class="art-like-u"></ul> </div>  <div class="comment-list detaildzs_list" id="comment"> <h2 class="title2">评论</h2> </div> <div class="c-form" id="cForm">  <p class="c-login special-login">发布评论请先 <a href="javascript:;">登录</a></p> </div> <div class="article-list"> <p>相关推荐</p> <div class="article" style="padding-left: 0px;"> <h2 class="title"> <a href="//www.obk20.com/bbs/jishu_459461_1_1.html" target="_blank" > <b class='flag-5'>中文</b>版《CMOS超<b class='flag-5'>大规模</b>集成电路设计》第4版</a> </h2> <div class="summary">` 本帖最后由 chenchu0910 于 2015-5-28 12:01 编辑 <b class='flag-5'>中文</b>版CMOS超<b class='flag-5'>大规模</b>集成电路设计第4版附件都要下载才能解压缩没有权限限制<b class='flag-5'>了</b>`</div> <div class="info"> <span class="fby">发表于</span> 11-24 18:24  </div> </div> <div class="article" style="padding-left: 0px;"> <h2 class="title"> <a href="//www.obk20.com/bbs/jishu_1709352_1_1.html" target="_blank" > 简单有效的多标准<b class='flag-5'>中文</b>分词详解</a> </h2> <div class="summary">，<b class='flag-5'>语料库</b>往往珍稀且珍贵。具体到<b class='flag-5'>中文</b>分词，也是如此。为了做出一个实用的系统，不光需要高效的算法，<b class='flag-5'>大规模</b><b class='flag-5'>语料库</b>也必不可少。然而对于缺乏经费的研究团队和个人，却往往只能得到sighan200</div> <div class="info"> <span class="fby">发表于</span> 12-28 14:39  </div> </div> <div class="article" style="padding-left: 0px;"> <h2 class="title"> <a href="//www.obk20.com/bbs/jishu_1728952_1_1.html" target="_blank" > pyhanlp文本分类与情感分析</a> </h2> <div class="summary">) throws IllegalArgumentException, IOException;例如：每个分类里面都是一些文本文档。任何满足此格式的<b class='flag-5'>语料库</b>都可以直接加载。数据集实现考虑到<b class='flag-5'>大规模</b>训练的时候</div> <div class="info"> <span class="fby">发表于</span> 02-20 15:37  </div> </div> <div class="article" style="padding-left: 0px;"> <h2 class="title"> <a href="//www.obk20.com/bbs/jishu_1812012_1_1.html" target="_blank" > <b class='flag-5'>大规模</b>MIMO的性能</a> </h2> <div class="summary">轨迹产生的容量斜坡仍然比需求线平坦。面对此挑战，3GPP 标准实体近来提出了数据容量“到2020 年增长1000 倍”的目标，以满足演进性或革命性创意的需要。这种概念要求基站部署极<b class='flag-5'>大规模</b>的天线阵</div> <div class="info"> <span class="fby">发表于</span> 07-17 07:54  </div> </div> <div class="article" style="padding-left: 0px;"> <h2 class="title"> <a href="//www.obk20.com/bbs/jishu_1883128_1_1.html" target="_blank" > NLPIR平台提供快捷简便的语义分析工具</a> </h2> <div class="summary">提供的都是自然语言处理云服务平台，要求使用者上传待处理的<b class='flag-5'>语料库</b>，如腾讯<b class='flag-5'>NLP</b>云服务、百度 <b class='flag-5'>NLP</b>云服务。云端存储的数据资源脱离了上传者后，数据确权上没有法律保障，存在数据泄露并被窃取滥用的巨大隐患</div> <div class="info"> <span class="fby">发表于</span> 11-12 17:27  </div> </div> <div class="article" style="padding-left: 0px;"> <h2 class="title"> <a href="//www.obk20.com/bbs/jishu_1927940_1_1.html" target="_blank" > Flair如何使用加载<b class='flag-5'>语料库</b></a> </h2> <div class="summary">工具篇Flair之使用加载<b class='flag-5'>语料库</b>教程</div> <div class="info"> <span class="fby">发表于</span> 04-27 10:03  </div> </div> <div class="article" style="padding-left: 0px;"> <h2 class="title"> <a href="//www.obk20.com/soft/study/yl/2009/2009042222708.html" target="_blank" > 中医汉英双语<b class='flag-5'>语料库</b>平台</a> </h2> <div class="summary">构建中医汉英双语<b class='flag-5'>语料库</b>平台并介绍其主要功能。该平台以经典中医文献<b class='flag-5'>语料</b>为生<b class='flag-5'>语料</b>，通过<b class='flag-5'>语料</b>匹配程序和智能自增词典等威廉希尔官方网站实现<b class='flag-5'>语料</b>加工入库功能，运用</div> <div class="info"> <span class="fby">发表于</span> 04-22 09:01  <span class="sp">•</span><span class="" data-id="">19</span>次下载 </div> </div> <div class="article" style="padding-left: 0px;"> <h2 class="title"> <a href="//www.obk20.com/soft/study/ms/2017/20170309495043.html" target="_blank" > 面向<b class='flag-5'>中文语料库</b>的模式检索研究邱冰</a> </h2> <div class="summary">面向<b class='flag-5'>中文语料库</b>的模式检索研究_邱冰</div> <div class="info"> <span class="fby">发表于</span> 03-15 08:00  <span class="sp">•</span><span class="" data-id="">0</span>次下载 </div> </div> <div class="article" > <h2 class="title"> <a href="//www.obk20.com/soft/study/net/2017/20171204593422.html" target="_blank" > 双语协同<b class='flag-5'>中文</b>关系抽取方法</a> </h2> <div class="summary">针对在<b class='flag-5'>中文</b>资源的关系抽取中，由于<b class='flag-5'>中文</b>长句句式复杂，句法特征提取难度大、准确度低等问题，提出了一种基于平行<b class='flag-5'>语料库</b>的双语协同<b class='flag-5'>中文</b>关系抽取方法。首先在中英双语平行</div> <div class="info"> <span class="fby">发表于</span> 12-04 14:56  <span class="sp">•</span><span class="" data-id="">0</span>次下载 </div> <a href="//www.obk20.com/soft/study/net/2017/20171204593422.html" class="thumb" target="_blank"> <img src="https://file.elecfans.com/web2/M00/49/71/poYBAGKhwLSALy2KAAAZq9emRgo911.jpg" alt="双语协同<b class='flag-5'>中文</b>关系抽取方法" /> </a> </div> <div class="article" > <h2 class="title"> <a href="//www.obk20.com/soft/study/inbuilt/2017/20171205594453.html" target="_blank" > 汉语口语互动分级<b class='flag-5'>语料库</b>的构建</a> </h2> <div class="summary">介绍<b class='flag-5'>了</b>一个汉语口语互动分级<b class='flag-5'>语料库</b>的构建工作。该<b class='flag-5'>语料库</b>为国内首个汉语口语互动分级<b class='flag-5'>语料库</b>，记录了测试环境下学生口语互动的实际情况。<b class='flag-5'>语料库</b>由超过1</div> <div class="info"> <span class="fby">发表于</span> 12-05 13:43  <span class="sp">•</span><span class="" data-id="">0</span>次下载 </div> <a href="//www.obk20.com/soft/study/inbuilt/2017/20171205594453.html" class="thumb" target="_blank"> <img src="https://file.elecfans.com/web2/M00/49/72/poYBAGKhwLWAKbkZAAAZO-gJmFU205.jpg" alt="汉语口语互动分级<b class='flag-5'>语料库</b>的构建" /> </a> </div> <div class="article" > <h2 class="title"> <a href="//www.obk20.com/soft/20/2018/20180702703742.html" target="_blank" > 婴幼儿<b class='flag-5'>语料库</b>人工智能威廉希尔官方网站的详细<b class='flag-5'>中文</b>资料概述</a> </h2> <div class="summary">人类婴儿由于出生时过于虚弱，不具备主动接近成人的行为能力，因此在9个月之前，其主要通过哭声吸引成人的注意，并向成人表达他的需求。婴幼儿<b class='flag-5'>语料库</b>是按照一定采样标准采集的电子数据集合，随着大数据时代的到来</div> <div class="info"> <span class="fby">发表于</span> 07-02 08:00  <span class="sp">•</span><span class="" data-id="">3</span>次下载 </div> <a href="//www.obk20.com/soft/20/2018/20180702703742.html" class="thumb" target="_blank"> <img src="https://file.elecfans.com/web1/M00/56/16/pIYBAFs5jAqAL2LSAABTiAuFpOg353.png" alt="婴幼儿<b class='flag-5'>语料库</b>人工智能威廉希尔官方网站的详细<b class='flag-5'>中文</b>资料概述" /> </a> </div> <div class="article" style="padding-left: 0px;"> <h2 class="title"> <a href="//www.obk20.com/d/1216228.html" target="_blank" > 一些<b class='flag-5'>中文</b><b class='flag-5'>NLP</b>领域，构建<b class='flag-5'>语料</b>的经验和技巧</a> </h2> <div class="summary">虽然通过这些途径，能够搜集到不少的<b class='flag-5'>NLP</b><b class='flag-5'>语料</b>，但这些“现成”的<b class='flag-5'>语料</b>往往与我们需要解决的 <b class='flag-5'>NLP</b> 问题不太一致，因此我们还得想办法去变一些<b class='flag-5'>语料</b></div> <div class="info"> <a class="face s" href="" target="_blank" rel="nofollow"> <img src="" alt="的头像"/> </a> <span class="fby">发表于</span> 05-12 09:57  <span class="sp">•</span><span class="" data-id="">4420</span>次阅读 </div> </div> <div class="article" style="padding-left: 0px;"> <h2 class="title"> <a href="//www.obk20.com/d/1870873.html" target="_blank" > 利用对比前缀控制文本生成以及长文本生成的动态内容规划</a> </h2> <div class="summary">一些最新的研究表明，预训练语言模型（PLM）可以通过自我监督的预训练从<b class='flag-5'>大规模</b><b class='flag-5'>语料库</b>中自动获取知识，然后将学到的知识编码到模型参数中。然而，由于词汇量有限，PLM难以从<b class='flag-5'>大规模</b><b class='flag-5'>语料库</b>中回忆</div> <div class="info"> <a class="face s" href="" target="_blank" rel="nofollow"> <img src="" alt="的头像"/> </a> <span class="fby">发表于</span> 08-02 15:06  <span class="sp">•</span><span class="" data-id="">1438</span>次阅读 </div> </div> <div class="article" style="padding-left: 0px;"> <h2 class="title"> <a href="//www.obk20.com/d/2422148.html" target="_blank" > 数据<b class='flag-5'>语料库</b>、算法框架和算力芯片在AI大模型中的作用和影响</a> </h2> <div class="summary">数据<b class='flag-5'>语料库</b>、算法框架和算力芯片的确是影响AI大模型发展的三大重要因素。</div> <div class="info"> <a class="face s" href="" target="_blank" rel="nofollow"> <img src="" alt="的头像"/> </a> <span class="fby">发表于</span> 03-01 09:42  <span class="sp">•</span><span class="" data-id="">1086</span>次阅读 </div> </div> <div class="article" style="padding-left: 0px;"> <h2 class="title"> <a href="//www.obk20.com/d/3842212.html" target="_blank" > <b class='flag-5'>nlp</b>自然语言处理框架有哪些</a> </h2> <div class="summary">语言中最著名的<b class='flag-5'>NLP</b><b class='flag-5'>库</b>之一，由Steven Bird、Ewan Klein和Edward Loper等人开发。NLTK提供<b class='flag-5'>了</b>丰富的资源，包括文本处理、<b class='flag-5'>语料库</b>、</div> <div class="info"> <a class="face s" href="" target="_blank" rel="nofollow"> <img src="" alt="的头像"/> </a> <span class="fby">发表于</span> 07-09 10:28  <span class="sp">•</span><span class="" data-id="">560</span>次阅读 </div> </div> </div> </div> </article> <aside class="aside">  <input type="hidden" name="zl_mp" value="0"> <div id="new-adsm-berry" ></div> <div id="new-company-berry"></div>  <div class="aside-section"> <div class="aside-section-head"> <h3 class="aside-section-name">精选推荐</h3> <a class="aside-section-more" id="recMore" href="//www.obk20.com/d/">更多<i class="arrow_right"></i></a> </div> <div class="aside-section-body"> <ul class="article-rec-tabs"> <li data-index="0" class="is-active">文章</li> <li data-index="2" >资料</li> <li data-index="3" >帖子</li> </ul>  <ul class="article-rec-content is-active"> <li class="article-rec-item"> <div class="col-right"> <h4 class="text-title"> <a href="//www.obk20.com/d/6408462.html" target="_blank"> <span>DC/DC 转换器输出电压调整的方法，包括数字通信接口、数字输入和模拟输入三种方式</span> </a> </h4> <div class="text-content"> <a class="text-name" href="//www.obk20.com/d/user/1052410/" target="_blank">eeDesigner</a> <div class="text-date">6小时前</div> <div class="text-view">174 阅读</div> </div> </div> </li><li class="article-rec-item"> <div class="col-right"> <h4 class="text-title"> <a href="//www.obk20.com/d/6408440.html" target="_blank"> <span>芯擎科技CEO汪凯：抓住智能化发展机遇，国产高端汽车芯片掘金千亿蓝海赛道</span> </a> </h4> <div class="text-content"> <a class="text-name" href="//www.obk20.com/d/user/2351591/" target="_blank">章鹰观察</a> <div class="text-date">7小时前</div> <div class="text-view">293 阅读</div> </div> </div> </li><li class="article-rec-item"> <div class="col-right"> <h4 class="text-title"> <a href="//www.obk20.com/d/6408414.html" target="_blank"> <span>如何解決信号完整性问题</span> </a> </h4> <div class="text-content"> <a class="text-name" href="//www.obk20.com/d/user/4997353/" target="_blank">深圳市赛姆烯金科技有限公司</a> <div class="text-date">7小时前</div> <div class="text-view">246 阅读</div> </div> </div> </li><li class="article-rec-item"> <div class="col-right"> <h4 class="text-title"> <a href="//www.obk20.com/d/6408056.html" target="_blank"> <span>康谋分享 | 如何应对ADAS/AD海量数据处理挑战？</span> </a> </h4> <div class="text-content"> <a class="text-name" href="//www.obk20.com/d/c6348282" target="_blank">康谋自动驾驶</a> <div class="text-date">14小时前</div> <div class="text-view">338 阅读</div> </div> </div> </li><li class="article-rec-item"> <div class="col-right"> <h4 class="text-title"> <a href="//www.obk20.com/d/6408034.html" target="_blank"> <span>浅谈SQL优化小技巧</span> </a> </h4> <div class="text-content"> <a class="text-name" href="//www.obk20.com/bbs/user/6452013/" target="_blank">京东云</a> <div class="text-date">14小时前</div> <div class="text-view">256 阅读</div> </div> </div> </li> </ul>    <ul class="article-rec-content"> <li class="article-rec-item"> <div class="col-left"> <div class="icon-type rar"></div> </div> <div class="col-right"> <h4 class="text-title"> <a href="//www.obk20.com/soft/70/2011/20110302189400.html" target="_blank"> <span>用于低压照明的100VA调光电子变换器</span> </a> </h4> <div class="text-content"> <a class="text-name" href="//www.obk20.com/bbs/user/2253382/" target="_blank">张杰</a> <div class="text-date">394 KB</div> <div class="text-date">5积分</div> <div class="text-down">45下载</div> </div> </div> </li><li class="article-rec-item"> <div class="col-left"> <div class="icon-type zip"></div> </div> <div class="col-right"> <h4 class="text-title"> <a href="//www.obk20.com/soft/Mec/2022/202204141817040.html" target="_blank"> <span>StarryPilot轻量且强大的开源自驾仪</span> </a> </h4> <div class="text-content"> <a class="text-name" href="//www.obk20.com/bbs/user/2255549/" target="_blank">贺服窍</a> <div class="text-date">61.39 MB</div> <div class="text-date">免费</div> <div class="text-down">0下载</div> </div> </div> </li><li class="article-rec-item"> <div class="col-left"> <div class="icon-type zip"></div> </div> <div class="col-right"> <h4 class="text-title"> <a href="//www.obk20.com/soft/Mec/2022/202204201823015.html" target="_blank"> <span>smart-mqtt MQTT Broker服务</span> </a> </h4> <div class="text-content"> <a class="text-name" href="//www.obk20.com/bbs/user/2010163/" target="_blank">百灵千岛酱</a> <div class="text-date">0.13 MB</div> <div class="text-date">2积分</div> <div class="text-down">2下载</div> </div> </div> </li><li class="article-rec-item"> <div class="col-left"> <div class="icon-type zip"></div> </div> <div class="col-right"> <h4 class="text-title"> <a href="//www.obk20.com/soft/Mec/2022/202204271826377.html" target="_blank"> <span>Nagios WAS WebSphere监控</span> </a> </h4> <div class="text-content"> <a class="text-name" href="//www.obk20.com/bbs/user/2253342/" target="_blank">贾小龙</a> <div class="text-date">1.05 MB</div> <div class="text-date">2积分</div> <div class="text-down">1下载</div> </div> </div> </li><li class="article-rec-item"> <div class="col-left"> <div class="icon-type zip"></div> </div> <div class="col-right"> <h4 class="text-title"> <a href="//www.obk20.com/soft/6/2022/202209271899016.html" target="_blank"> <span>RoboMaster15驱动程序源码</span> </a> </h4> <div class="text-content"> <a class="text-name" href="//www.obk20.com/bbs/user/509005/" target="_blank">jinyi7016</a> <div class="text-date">0.31 MB</div> <div class="text-date">9积分</div> <div class="text-down">3下载</div> </div> </div> </li> </ul>   <ul class="article-rec-content"> <li class="article-rec-item"> <div class="col-right"> <h4 class="text-title"> <a href="//www.obk20.com/bbs/jishu_2470539_1_1.html" target="_blank"> <span>求大佬指点，此时此刻我应该用赛灵思7010或者7020哪个型号的芯片合适呢？</span> </a> </h4> <div class="text-content"> <a class="text-name" href="//www.obk20.com/bbs/user/6720695/" target="_blank">jf_42444418</a> <div class="text-date">1天前</div> <div class="text-view">259 阅读</div> </div> </div> </li><li class="article-rec-item"> <div class="col-right"> <h4 class="text-title"> <a href="//www.obk20.com/bbs/jishu_2470323_1_1.html" target="_blank"> <span>2K300开发板 USB识别</span> </a> </h4> <div class="text-content"> <a class="text-name" href="//www.obk20.com/bbs/user/6706035/" target="_blank">jf_69192048</a> <div class="text-date">2天前</div> <div class="text-view">299 阅读</div> </div> </div> </li><li class="article-rec-item"> <div class="col-right"> <h4 class="text-title"> <a href="//www.obk20.com/bbs/jishu_2470525_1_1.html" target="_blank"> <span>UC2844反激开关电源出现打嗝现象，求助</span> </a> </h4> <div class="text-content"> <a class="text-name" href="//www.obk20.com/bbs/user/5174475/" target="_blank">jf_97861207</a> <div class="text-date">1天前</div> <div class="text-view">271 阅读</div> </div> </div> </li><li class="article-rec-item"> <div class="col-right"> <h4 class="text-title"> <a href="//www.obk20.com/bbs/jishu_2470523_1_1.html" target="_blank"> <span>迅为RK3568开发板EMMC镜像导出打包update.img</span> </a> </h4> <div class="text-content"> <a class="text-name" href="//www.obk20.com/bbs/user/5842530/" target="_blank">jf_23361246</a> <div class="text-date">1天前</div> <div class="text-view">242 阅读</div> </div> </div> </li><li class="article-rec-item"> <div class="col-right"> <h4 class="text-title"> <a href="//www.obk20.com/bbs/jishu_2470516_1_1.html" target="_blank"> <span>想设计一个电子选频电路</span> </a> </h4> <div class="text-content"> <a class="text-name" href="//www.obk20.com/bbs/user/2761636/" target="_blank">Kaizhao</a> <div class="text-date">1天前</div> <div class="text-view">290 阅读</div> </div> </div> </li> </ul>      </div> </div>  <div id="new-course-berry" ></div>  <div class="aside-section dzs-article-column"> <div class="aside-section-head"> <h3 class="aside-section-name">推荐专栏</h3> <a class="aside-section-more" href="//www.obk20.com/d/column">更多<i class="arrow_right"></i></a> </div> <div class="aside-section-body"> <ul class="dzs-article-column-list"></ul> </div> </div> <div id="new-webinar-berry"></div> <div id="IndexRightBottom"></div> </aside> </section>  <input type="hidden" name="aid" id="webID" value="864841">  <input type="hidden" class="store_flag" value="0"> <input type="hidden" class="evip_type" value="0">  <input type="hidden" class="evip_article_id" value="">  <input type="hidden" class="evip_id" value="">  <input type="hidden" name="isPayEvip" class="isPayEvip" value="0"> <input type="hidden" class="vip-limit-read" value="0"> <input type="hidden" id="headerType" value="data"> <input type="hidden" id="details_right_hero" value="true"> <input type="hidden" id="currentUserID" value="" /> <div class="gather-bottom"></div> <link rel="stylesheet" href="/static/footer/footer.css?20230919" /> <div class="public-footer"> <div class="public-footer__hd"> <dl> <dt>华秋（原“华强聚丰”）：</dt> <dd>电子发烧友</dd> <dd>华秋开发</dd> <dd>华秋电路(原"华强PCB")</dd> <dd>华秋商城(原"华强芯城")</dd> <dd>华秋智造</dd> </dl> <dl> <dd><a target="_blank" href="//www.obk20.com/bbs/infocenter.php" rel="nofollow">My ElecFans </a></dd> <dd><a target="_blank" href="//www.obk20.com/app/"> APP </a></li> <dd><a target="_blank" href="//www.obk20.com/about/sitemap.html">网站地图</a></dd> </dl> </div> <div class="public-footer__main"> <dl> <dt>英国威廉希尔公司网站 </dt> <dd><a href="//www.obk20.com/pld/" target="_blank">william hill 中国 </a></dd> <dd><a href="//www.obk20.com/article/83/" target="_blank">电源/新能源</a></dd> <dd><a href="//www.obk20.com/article/88/142/" target="_blank">MEMS/传感威廉希尔官方网站 </a></dd> <dd><a href="//www.obk20.com/article/85/" target="_blank">2018威廉希尔决赛赔率 </a></dd> <dd><a href="//www.obk20.com/emb/" target="_blank">嵌入式威廉希尔官方网站 </a></dd> <dd><a href="//www.obk20.com/article/90/155/" target="_blank">制造/封装</a></dd> <dd><a href="//www.obk20.com/analog/" target="_blank">interwetten与威廉的赔率体系 </a></dd> <dd><a href="//www.obk20.com/tongxin/rf/" target="_blank">RF/无线</a></dd> <dd><a href="//www.obk20.com/emb/jiekou/" target="_blank">接口/总线/驱动</a></dd> <dd><a href="//www.obk20.com/emb/dsp/" target="_blank">william hill </a></dd> <dd><a href="//www.obk20.com/bandaoti/eda/" target="_blank">EDA/IC设计</a></dd> <dd><a href="//www.obk20.com/consume/cunchujishu/" target="_blank">存储威廉希尔官方网站 </a></dd> <dd><a href="//www.obk20.com/xianshi/" target="_blank">wh867 </a></dd> <dd><a href="//www.obk20.com/emc_emi/" target="_blank">EMC/EMI设计</a></dd> <dd><a href="//www.obk20.com/connector/" target="_blank">连接器</a></dd> </dl> <dl> <dt>william hill官网 </dt> <dd><a href="//www.obk20.com/led/" target="_blank">LEDs </a></dd> <dd><a href="//www.obk20.com/qichedianzi/" target="_blank">汽车电子</a></dd> <dd><a href="//www.obk20.com/video/" target="_blank">音视频及家电</a></dd> <dd><a href="//www.obk20.com/tongxin/" target="_blank">通信网络</a></dd> <dd><a href="//www.obk20.com/yiliaodianzi/" target="_blank">医疗电子</a></dd> <dd><a href="//www.obk20.com/rengongzhineng/" target="_blank">人工智能</a></dd> <dd><a href="//www.obk20.com/vr/" target="_blank">虚拟现实</a></dd> <dd><a href="//www.obk20.com/wearable/" target="_blank">可穿戴设备</a></dd> <dd><a href="//www.obk20.com/jiqiren/" target="_blank">机器人</a></dd> <dd><a href="//www.obk20.com/application/Security/" target="_blank">安全设备/系统</a></dd> <dd><a href="//www.obk20.com/application/Military_avionics/" target="_blank">军用/航空电子</a></dd> <dd><a href="//www.obk20.com/application/Communication/" target="_blank">移动通信</a></dd> <dd><a href="//www.obk20.com/kongzhijishu/" target="_blank">工业控制</a></dd> <dd><a href="//www.obk20.com/consume/bianxiedianzishebei/" target="_blank">便携设备</a></dd> <dd><a href="//www.obk20.com/consume/chukongjishu/" target="_blank">触控感测</a></dd> <dd><a href="//www.obk20.com/iot/" target="_blank">物联网</a></dd> <dd><a href="//www.obk20.com/dianyuan/diandongche_xinnenyuan/" target="_blank">智能电网</a></dd> <dd><a href="//www.obk20.com/blockchain/" target="_blank">区块链</a></dd> <dd><a href="//www.obk20.com/xinkeji/" target="_blank">新科技</a></dd> </dl> <dl> <dt>特色内容</dt> <dd><a href="//www.obk20.com/d/column/" target="_blank">专栏推荐</a></dd> <dd><a target="_blank" href="//www.obk20.com/t/">学院</a></dd> <dd><a target="_blank" href="//www.obk20.com/bbs/group_716">设计资源</a></dd> <dd><a target="_blank" href="//www.obk20.com/technical/">英国威廉希尔公司网站 </a></dd> <dd><a target="_blank" href="//www.obk20.com/baike/">电子百科</a></dd> <dd><a target="_blank" href="//www.obk20.com/dianzishipin/">电子视频</a></dd> <dd><a target="_blank" href="//www.obk20.com/yuanqijian/">元器件知识</a></dd> <dd><a target="_blank" href="//www.obk20.com/tools/">工具箱</a></dd> <dd><a target="_blank" href="//www.obk20.com/vip/#choose">VIP会员</a></dd> <dd><a target="_blank" href="//www.obk20.com/article/special/">最新威廉希尔官方网站文章</a></dd> </dl> <dl> <dt>社区</dt> <dd><a target="_blank" href="//www.obk20.com/bbs/group">小组</a></dd> <dd><a target="_blank" href="//www.obk20.com/bbs/">论坛</a></dd> <dd><a target="_blank" href="//www.obk20.com/bbs/ask.html">问答</a></dd> <dd><a target="_blank" href="//www.obk20.com/bbs/try.html">评测试用</a></dd> <dt><a target="_blank" href="//www.obk20.com/q/">企业服务</a></dt> <dd><a target="_blank" href="//www.obk20.com/q/p/">产品</a></dd> <dd><a target="_blank" href="//www.obk20.com/q/soft/">资料</a></dd> <dd><a target="_blank" href="//www.obk20.com/q/d/">文章</a></dd> <dd><a target="_blank" href="//www.obk20.com/q/sol/">方案</a></dd> <dd><a target="_blank" href="//www.obk20.com/q/c/">企业</a></dd> </dl> <dl> <dt>供应链服务</dt> <dd><a target="_blank" href="//www.obk20.com/kf/">硬件开发</a></dd> <dd><a target="_blank" href="https://www.hqpcb.com/">华秋电路</a></dd> <dd><a target="_blank" href="https://www.hqchip.com/">华秋商城</a></dd> <dd><a target="_blank" href="https://smt.hqchip.com/">华秋智造</a></dd> <dd><a target="_blank" href="https://www.nextpcb.com/">nextPCB</a></dd> <dd><a target="_blank" href="https://www.hqchip.com/bom.html">BOM配单</a></dd> <dt>媒体服务</dt> <dd><a target="_blank" href="//www.obk20.com/about/service.html">网站广告</a></dd> <dd><a target="_blank" href="//www.obk20.com/webinar/">在线研讨会</a></dd> <dd><a target="_blank" href="//www.obk20.com/event/">活动策划</a></dd> <dd><a target="_blank" href="//www.obk20.com/news/">新闻发布</a></dd> <dd><a target="_blank" href="//www.obk20.com/xinpian/ic/">新品发布</a></dd> <dd><a target="_blank" href="//www.obk20.com/quiz/">小测验</a></dd> <dd><a target="_blank" href="//www.obk20.com/contest/">设计大赛</a></dd> </dl> <dl> <dt>华秋</dt> <dd><a target="_blank" href="//www.obk20.com/about/" rel="nofollow">关于我们</a></dd> <dd><a target="_blank" href="https://www.hqchip.com/help/factsheet.html" rel="nofollow">投资关系</a></dd> <dd><a target="_blank" href="https://www.hqchip.com/help/news/lists.html" rel="nofollow">新闻动态</a></dd> <dd><a target="_blank" href="//www.obk20.com/about/zhaopin.html" rel="nofollow">加入我们</a></dd> <dd><a target="_blank" href="//www.obk20.com/about/contact.html" rel="nofollow">联系我们</a></dd> <dd><a target="_blank" href="//www.obk20.com/about/tousu.html" rel="nofollow">举报投诉</a></dd> <dt>社交网络</dt> <dd><a target="_blank" href="https://weibo.com/elecfanscom" rel="nofollow">微博</a></dd> <dt>移动端</dt> <dd><a target="_blank" href="//www.obk20.com/app/">发烧友APP</a></dd> <dd><a target="_blank" href="//www.obk20.com/yingsheng/app?eleclog">硬声APP</a></dd> <dd><a target="_blank" href="https://m.obk20.com">WAP</a></dd> </dl> <dl> <dt>联系我们</dt> <dd class="small_tit">广告合作</dd> <dd>王婉珠：<a href="mailto:wangwanzhu@elecfans.com">wangwanzhu@elecfans.com</a></dd> <dd class="small_tit">内容合作</dd> <dd>黄晶晶：<a href="mailto:huangjingjing@elecfans.com">huangjingjing@elecfans.com</a></dd> <dd class="small_tit">内容合作（海外）</dd> <dd>张迎辉：<a href="mailto:mikezhang@elecfans.com">mikezhang@elecfans.com</a></dd> <dd class="small_tit">供应链服务 PCB/IC/PCBA</dd> <dd>江良华：<a href="mailto:lanhu@huaqiu.com">lanhu@huaqiu.com</a></dd> <dd class="small_tit">投资合作</dd> <dd>曾海银：<a href="mailto:zenghaiyin@huaqiu.com">zenghaiyin@huaqiu.com</a></dd> <dd class="small_tit">社区合作</dd> <dd>刘勇：<a href="mailto:liuyong@huaqiu.com">liuyong@huaqiu.com</a></dd> </dl> <ul class="qr-code"> <li> <p>关注我们的微信</p> <img src="/static/main/img/elecfans_code.jpg" alt="关注我们的微信" /> </li> <li> <p>下载发烧友APP</p> <img src="/static/main/img/elec_app_code.jpg" alt="下载发烧友APP" /> </li> <li> <p>电子发烧友观察</p> <img src="/static/main/img/elec_focus_code.jpg" alt="电子发烧友观察" /> </li> </ul> </div> <div class="public-footer__ft"> <div class="public-footer__ft-inner"> <a href="https://www.huaqiu.com/" target="_blank" class="public-footer__ft-logo"> <img class="is-default" src="/static/footer/image/footer-01-default.png" alt="华秋电子" /> <img class="is-hover" src="/static/footer/image/footer-01.png" alt="华秋电子" /> </a> <div class="public-footer__ft-right"> <div class="public-footer__ft-item public-footer__ft-elecfans"> <div class="hd"> <a href="//www.obk20.com/" target="_blank">  <div class="site_foot_img"> <img src="/static/footer/image/elecfans-logo.svg" alt="华秋发烧友"> </div> <div class="site_foot_text">电子工程师社区</div> </a> </div> </div> <div class="public-footer__ft-item public-footer__ft-hqpcb"> <div class="hd"> <a href="https://www.hqpcb.com/" target="_blank"> <div class="site_foot_img"> <img src="/static/footer/image/hqpcb-logo.svg" alt="华秋电路"> </div> <div class="site_foot_text">1-32层PCB打样·中小批量</div> </a> </div> </div> <div class="public-footer__ft-item public-footer__ft-hqchip"> <div class="hd"> <a href="https://www.hqchip.com/" target="_blank"> <div class="site_foot_img"> <img src="/static/footer/image/hqchip-logo.svg" alt="华秋商城"> </div> <div class="site_foot_text">元器件现货·全球代购·SmartBOM</div> </a> </div> </div> <div class="public-footer__ft-item public-footer__ft-smt"> <div class="hd"> <a href="https://smt.hqchip.com/" target="_blank"> <div class="site_foot_img"> <img src="/static/footer/image/smt-logo.svg" alt="华秋智造"> </div> <div class="site_foot_text">SMT贴片·PCBA加工</div> </a> </div> </div> <div class="public-footer__ft-item public-footer__ft-nextpcb"> <div class="hd"> <a href="javascript:void(0)" class="next-pck-link"> <div class="site_foot_img"> <img src="/static/footer/image/nextpcb-logo.svg" alt="NextPCB"> </div> <div class="site_foot_text">PCB Manufacturer</div> </a> </div> </div> <ul class="public-footer__ft-text"> <li><a href="https://www.huaqiu.com/about/groupoverview" target="_blank">华秋简介</a></li> <li><a href="https://www.huaqiu.com/news" target="_blank">企业动态</a></li> <li><a href="https://www.huaqiu.com/about/contactus" target="_blank">联系我们</a></li> <li><a href="https://www.huaqiu.com/about/corporateculture" target="_blank">企业文化</a></li> <li><a href="https://www.huaqiu.com/about/promotionalfilm" target="_blank">企业宣传片</a></li> <li><a href="https://www.huaqiu.com/jobs" target="_blank">加入我们</a></li> </ul> </div> </div> </div> <div class="public-footer__copyright"> <p>版权所有 © 湖南华秋数字科技有限公司 </p> <p>长沙市望城经济威廉希尔官方网站开发区航空路6号手机智能终端产业园2号厂房3层（0731-88081133）</p> <a href="//www.obk20.com/">电子发烧友</a> <a href="//www.obk20.com/" target="_blank"><strong>（电路图）</strong></a> <a href="https://beian.mps.gov.cn/#/query/webSearch?code=43011202000918" target="_blank" rel="nofollow">湘公网安备43011202000918</a>  <a href="http://szcert.ebs.org.cn/c6db625a-ba09-414a-bba4-f57240baac9c6" target="_blank" rel="nofollow"> <img src="//skin.elecfans.com/images/ebsIcon.png" alt="工商网监认证">工商网监 </a> <a href="https://beian.miit.gov.cn/#/Integrated/index" target="_blank" rel="nofollow">湘ICP备2023018690号-1</a> </div> <div><input type="hidden" value="0" name="arc_relate_vid"></div> </div> <link rel="stylesheet" href="/webapi/public/project/idt/iconfont/iconfont.css"> <script src="https://skin.elecfans.com/js/elecfans_jquery.js"></script> <script src="https://staticd.elecfans.com/js/plugins.js"></script> <script> (function () { postmessageScript() function postmessageScript() { /* * postmessage */ var con_net = "" if (window.location.href.indexOf(".net") > -1) { con_net = "net" } else { con_net = "com" } var script = document.createElement('script'); script.type = 'text/javascript'; script.src = 'https://passport.elecfans.' + con_net + '/public/pc/plugin/postmessage.js'; var body = document.getElementsByTagName("body").item(0); body.appendChild(script); } /* * 推荐文章无图时样式修改 * */ $(".article .thumb").each(function () { if ($(this).find('img').attr('src') == "") { $(this).find('img').remove(); $(this).parent().css('padding-left', '0px'); } }); /*百度分享*/ window._bd_share_config = { common: { bdText: '', //自定义分享内容 bdDesc: '', //自定义分享摘要 bdPic: '' }, share: [{ "bdSize": 60 }] } with(document) 0[(getElementsByTagName('head')[0] || body).appendChild(createElement('script')).src = '']; })(); var add_url = '/d/article/write/'; var check_allow = "/d/api/iscantalk.html"; var click_items_length = $('.art_click_count').length; if (click_items_length > 0) { var id_str = ''; $('.art_click_count').each(function () { id_str += $(this).attr('data-id') + ','; }) var url = "/d/api/getclickbyids.html"; var id_data = 'id_str=' + id_str; $.ajax({ url: url, data: id_data, type: 'post', dataType: 'json', success: function (re) { if (re.list.length >= 1) { var list = re.list; for (var i in list) { var temp_id = list[i]['id']; var temp_span = $(".art_click_count[data-id=" + temp_id + "]") temp_span.html(list[i]['click']); } } } }) } function CheckLogin() { //alert(11) now_uid = ''; var ElecfansApi_checklogin = '/webapi/passport/checklogin'; var logout_url = "/d/login/logout.html"; var logout_url = 'https://bbs.elecfans.com/member.php?mod=logging&action=logout&refer=front'; $.get(ElecfansApi_checklogin, function (data, textStatus) { if (data != "") { EchoLoginInfo(data); CheckEmailInfo(data); data = $.parseJSON(data); now_uid = data.uid; /*var login_content = '<a href="//www.obk20.com/d/article/write/" class="btn write-article"><i class="icon-new-message"></i> 写文章</a><div class="mine" id="mine"><a class="item user" href="//www.obk20.com/d/user/'+now_uid+'/"><img src="'+data.avatar+'" width="33" height="33" /> <strong>'+data.username+'</strong></a><div id="mymenu" class="my-menu"><a class="logout" href="'+logout_url+'" ><i class="icon-switch"></i> 退出</a></div></div>';*/ var login_content = '<a href="javascript:;" class="btn write-article" id="write_btn"><i class="icon-new-message"></i> 写文章</a><div class="mine" id="mine"><a class="item user" href="//www.obk20.com/d/user/' + now_uid + '/"><img src="' + data.avatar + '" width="33" height="33" /> <strong>' + data .username + '</strong></a><div id="mymenu" class="my-menu"><a class="setting" href="//www.obk20.com/bbs/home.php?mod=spacecp" target="_blank" ><i class="icon-cog"></i> 设置</a><a class="logout" href="' + logout_url + '" ><i class="icon-switch"></i> 退出</a></div></div>'; $('#login_area').html(login_content); var win_width = $(window).width(); if (win_width > 1000) { $("#mine").mouseDelay(200).hover(function () { $("#mymenu").show(); }, function () { $("#mymenu").hide(); }); }; $('.newheader2021_tip_msg .tip_msg_num').text(data.msgnum).css({ 'display': 'inline' }); $('.no_login_2021').hide(); $('.yes_login_2021_more').css({ 'display': 'flex' }); $('.yes_login_2021').attr('href', 'https://bbs.elecfans.com/user/' + data.uid); $('.yes_login_2021 .vtm').attr('src', data.avatar); var yesLoginMoreBox = $('.yes_login_2021_more_box'); yesLoginMoreBox.find('.header_logo_2021').attr('href', 'https://bbs.elecfans.com/user/' + data .uid); yesLoginMoreBox.find('.header_logo_2021 img').attr('src', data.avatar); yesLoginMoreBox.find('.header_logo_right_2021').attr('href', 'https://bbs.elecfans.com/user/' + data.uid); yesLoginMoreBox.find('.usename_href_2021').attr('href', 'https://bbs.elecfans.com/user/' + data .uid).text(data.username); $(".header_bottom_2021 .favorite_articles_2021").attr("href", "https://bbs.elecfans.com/user/" + data.uid + "/favorite_articles?from=daohang"); $(".header_bottom_2021 .spacecp_2021").attr("href", "https://bbs.elecfans.com/home.php?mod=space&uid=" + data.uid + "&do=profile&from=daohang"); if (data.vip == 1) { yesLoginMoreBox.find('.header_VIP_2021').hide(); yesLoginMoreBox.find('.vip_icon img').attr('src', 'https://skin.elecfans.com/images/2021-soft/vip_icon2.png'); }; } else { remainLog(); var content = '<a class="item special-login " href="javascript:;" title="">登录</a><a class="item" href="//www.obk20.com/bbs/member.php?mod=reg" target="_blank">注册</a>'; $('#login_area').html(content); //.send-write,.absolute-write $(".special-login").click(function (e) { $.tActivityLogin(); return false; }); $('.no_login_2021').click(function () { $.ssoDialogLogin(); }) } }); } function getCookie(name) { var arr, reg = new RegExp("(^| )" + name + "=([^;]*)(;|$)"); if (arr = document.cookie.match(reg)) return unescape(arr[2]); else return null; } //添加提示注册引导 function remainLog() { if ($("#remainLogBox").length > 0) { return false; } var getRemainShow = getCookie('REMAINSHOWLOG'); /*设置注册框的主题内容*/ var content = '<div id="remainLogBox">' + '<div class="sso_layer"></div>' + '<div class="remain-log clearfix">' + '<div class="fl LogBgPart">' + '<h3>电子发烧友</h3> ' + '<p>中国电子工程师最喜欢的网站</p> ' + '<ul>' + '<li>与<span id="downNum">2931785</span>位工程师会员交流学习</li>' + '<li>获取您个性化的科技前沿威廉希尔官方网站信息</li> ' + '<li>参加活动获取丰厚的礼品</li> ' + '</ul>' + '</div>' + '<div class="fr LogRightPart">' + '<div id="colseRemainLog"><img src="https://skin.elecfans.com/images/remain_log_colse.png"></div>' + '<div id="ssoScrollLog"></div>' + '</div>' + '</div>' + '</div>'; $("body").append(content); $("#colseRemainLog").click(function () { var Days = 1; var exp = new Date(); exp.setTime(exp.getTime() + Days * 24 * 60 * 60 * 1000); /*存储cookie 用于点击关闭后一天不显示*/ document.cookie = 'REMAINSHOWLOG' + "=" + '1' + ";path= " + "/" + ";expires=" + exp.toGMTString(); $("#remainLogBox").remove(); $("html").css('overflow-y', 'auto'); }); setTimeout(function () { var netHost = window.location.host.split("."); $.ajax({ url: 'https://www.elecfans.' + netHost[2] + '/webapi/passport/totalaccount', dataType: 'json', success: function (data) { if (data.status == "successed") { $("#downNum").html(data.data.num); } } }) }, 1000); var getPathHref = location.pathname; /*判断是否是首页*/ if (getPathHref.length > 1 && getPathHref != "/index.html" && ($(".side-box.author-article").length > 0 || $( ".article .article-content").length > 0)) { var getLoadPageNum = getCookie('LoadPageNum'); if (getLoadPageNum) { var LoadPageUrl = getCookie('LoadPageUrl'); if (LoadPageUrl != location.pathname) { $(window).scroll(function () { /*滚动一屏页面后显示*/ if ($(window).scrollTop() > ($(window).height() / 2)) { if (getRemainShow != 1) { if ($("#remainLogBox").length > 0) { $("#remainLogBox").show(); $("html").css('overflow-y', 'hidden'); } } } }) } } else { var Days = 1; var exp = new Date(); exp.setTime(exp.getTime() + Days * 24 * 60 * 60 * 1000); /*存储cookie 用于点击关闭后一天不显示*/ document.cookie = 'LoadPageNum' + "=" + '1' + ";path= " + "/" + ";expires=" + exp.toGMTString(); var LoadPageUrl = getCookie('LoadPageUrl'); if (!LoadPageUrl) { document.cookie = 'LoadPageUrl' + "=" + location.pathname + ";path= " + "/" + ";expires=" + exp .toGMTString(); } } } } $(function () { var follow_wrap = $(".author-collect"); var now_uid = ""; var face_src = ""; var getFollowNum = $(".followNum strong").html(); //关注 $(window).on('click', '.author-collect', function () { if (now_uid == '') { $.tActivityLogin(); return false; } if($(".store_flag").val() == 15){ //企业号文章 if($(".evip_id").length == 0){return false} if ($(this).attr('id') == 'follow') { $.post('/webapi/home/evipArticle/followEvip', { evip_id : $(".evip_id").val(), action:'follow' }, function (data) { //返回的数据格式： if (data.code == "0") { follow_wrap.html('已关注').attr('id', 'cancelFollow').addClass( 'is-active'); }else{ alert(data.msg); } }); }else{ $.post('/webapi/home/evipArticle/followEvip',{ evip_id : $(".evip_id").val(), action:'cancel' }, function (data) { //返回的数据格式： if (data.code == "0") { follow_wrap.html('关注').attr('id', 'follow').removeClass( "is-active"); }else{ alert(data.msg); } }); } }else{ if ($(this).attr('id') == 'follow') { $.post('/d/user/follow', { tuid: article_user_id }, function (data) { //返回的数据格式： if (data.status == "successed") { $(".followNum strong").html(++getFollowNum); // follow_wrap.html('已关注').attr('id','cancelFollow').css('background','#999'); follow_wrap.html('已关注').attr('id', 'cancelFollow').addClass( 'is-active'); var follow_user = '<a href="//www.obk20.com/d/user/' + now_uid + '/" data-uid="' + now_uid + '" class="face" rel="nofollow"><img src="' + face_src + '"></a>'; $('#follow_list').append(follow_user); } if (data.status == "failed") { alert(data.msg); } }); }else{ $.post('/d/user/cancelFollow',{tuid: article_user_id }, function (data) { //返回的数据格式： if (data.status == "successed") { // follow_wrap.html('关注').attr('id', 'follow').css('background', '#f90'); follow_wrap.html('关注').attr('id', 'follow').removeClass( "is-active"); $(".followNum strong").html(--getFollowNum); $('#follow_list .face').each(function () { var target_uid = $(this).attr('data-uid'); if (target_uid == now_uid) { $(this).remove(); } }) } if (data.status == "failed") { alert(data.msg); } }); } } }); }); // 绑定手机号 $(".send-write").click(function () { $.ajax({ url: '/webapi/passport/checklogin', type: "get", dataType: 'json', success: function (login) { if (login == null) { $.ssoDialogLogin(); } else { isVerification(function () { window.open("/d/article/write/") }) } } }) }); /* * ********: 验证手机号 * callback: 验证成功的回调函数 */ // isVerification(function(){ // //完成手机号验证后判断是否完善资料 // isPerfectInfo($,document,function(){},false,true) // }) function isVerification_d(callback, article_write) { var passport = null; var bbs_host = null; if (location.host.indexOf(".com") > 0) { passport = window.location.protocol + "//passport.elecfans.com"; www_host = window.location.protocol + "//www.obk20.com"; } else { passport = window.location.protocol + "//passport.elecfans.net"; www_host = window.location.protocol + "//www.elecfans.net"; } $.ajax({ url: www_host + '/webapi/passport/checklogin', type: "get", dataType: 'json', success: function (login) { if (login) { $.ajax({ url: www_host + '/webapi/Mcenter/sms/getvalidstatus', type: "post", dataType: 'json', success: function (res) { var phoneTxt = "<p style='text-indent: 20px;margin-bottom: 10px;'>您好！为确保您账户的安全及正常使用，依《网络安全法》相关要求，4月22日起账户需绑定手机，如您还未绑定，请尽快完成，感谢您的理解及支持！</p>" var setHtml = function () { var _iframe = null; if (article_write === "article_write") { _iframe = '<div class="pop_verification_mask"><div class="pop_verification phone_verification">' + '<h6>请验证手机<i class="close_icon_d close_verification">╳</i></h6>' + '<div class="desc_txt">尊敬的用户：<br>' + phoneTxt + '</div>' + '<iframe class="phone_iframe" width="520" height="580" src="' + passport + '/Security/validatePhone/siteid/14.html"></iframe>' + '</div></div>' $('body').append(_iframe).ready(function () { $(".close_verification:eq(0)").click( function (e) { e.stopPropagation(); $.ajax({ url: www_host + '/webapi/Mcenter/sms/getvalidstatus', type: "post", dataType: 'json', success: function ( res) { if (res.data .phonestatus == 0) { layer .msg( "请先验证手机号" ) } else { $(".pop_verification_mask") .remove() } } }) }) }) } else { _iframe = '<div class="pop_verification_mask"><div class="pop_verification phone_verification">' + '<h6>请验证手机<i class="close_icon_d close_verification">╳</i></h6>' + '<div class="desc_txt">尊敬的用户：<br>' + phoneTxt + '</div>' + '<iframe class="phone_iframe" id="verificationIframe" width="488" height="580" src="' + passport + '/Security/validatePhone/siteid/14.html"></iframe>' + '</div></div>' $('body').append(_iframe).ready(function () { $(".close_verification:eq(0)").click( function (e) { e.stopPropagation(); $(".pop_verification").remove() if ($(".pop_verification_mask") .length >= 1) { $(".pop_verification_mask") .remove() } }); }) } } //已经验证手机号 if (res.data.phonestatus == 1) { if (typeof callback === "function") { callback() } } else { setHtml(); //没有完成验证先弹出手机验证 // 接受数据 // $.receiveMessage(function(msg){ // // 接收到纯数字时设置iframe的高度 // if($.isNumeric(msg.data)){ // }else if(typeof(msg.data)=="string"){ // } // }, passport); } } }) } else { //调用登录 $.ssoDialogLogin(); //单点登录 return false; //弹出登录 } } }) } $('body').css({ 'background-color': '#fff' }); $('.newheader2021').css({ 'border-bottom': 'solid 1px #e5e5e5' }); </script> <script src="https://staticd.elecfans.com/js/common.js?20230818"></script> <script src="https://staticd.elecfans.com/plugins/layer/layer.js"></script> <script src="https://skin.elecfans.com/js/elecfans/road_ad.js?20230818" defer></script> <script src="https://skin.elecfans.com/js/elecfans/organizing/js/organizing.js?20230710"></script> <script src="https://skin.elecfans.com/js/elecfans/interview.js?20230724"></script> <script type="text/javascript" src="https://staticd.elecfans.com/plugins/layer/layer.js"></script> <script type="text/javascript" src="/static/vendor/clipboard.min.js"></script> <script type="text/javascript" src="https://staticd.elecfans.com/js/share-web.js?20220223"></script> <script> var myface = "https://bbs.elecfans.com/uc_server/data/avatar/000/00/00/00_avatar_small.jpg"; var myname = ""; var article_title = '终于有了！大规模中文NLP语料库！'; var article_id = 864841; var article_user_id = 2737494;//文章作者ID var article_user_name = 'DPVg_AI_era'; var rightHeightChange = false; //专栏用户数据获取 var zlMp = $('input[name="zl_mp"]').val(); //是专栏用户 if (zlMp) { $.ajax({ url:"/d/Column/getUserCount", type:'get', data:{uid:article_user_id}, success:function(res){ if(res.code === 0){ //修改数量 $('.column-article-count').text(res.data.article); $('.column-view-count').text(res.data.view); $('.column-follow-count').text(res.data.follow_count); $('.column-praise-count').text(res.data.all_click); } else { console.log(res); } } }) } if(article_id) { dIsOriginal() } //原创标识接口 function dIsOriginal() { $.ajax({ url:"/webapi/arcinfo/isOriginal", type:'get', data:{aid:article_id}, success:function(re){ var res=JSON.parse(re) if(res.status==="successed"){ //1原创标识 if(res.data.is_original==1){ $(".yuanchuan_images").show() }else{ $(".yuanchuan_images").remove() } }else{ $(".yuanchuan_images").remove() } } }); } $('#delete_art').click(function(){ var art_id = $(this).attr('data-id'); var url = '/d/article/delete'; var data = "id="+art_id; layer.confirm('确定要删除？', { btn: ['取消','确定'] //按钮 }, function(){ layer.msg('已经取消', {icon: 1}); }, function(){ $.ajax({ url:url, type:'post', data:data, success:function(re){ if(re.error_code==200){ var uid = re.uid; var lurl = '/d/user/'+uid+'/'; layer.msg('已经删除', {icon: 1}); window.location.href = lurl; }else{ layer.msg(re.msg,{icon:1}); } } }) }); }); </script> <script src="https://staticd.elecfans.com/js/xgPlayer.js"></script> <script src="https://staticd.elecfans.com/js/article.js?v=20240328"></script> <script src="https://staticd.elecfans.com/js/column_article.js?v=c202307271023"></script> <script> $(document).ready(()=>{ /**推荐文章 */ $.ajax({ url: "/d/article/getArcList", type: "get", data: { type: "recommend", page: 1, size: 5 }, success: function (res) { if (res.code == 0) { renderArticle(res.data); rightHeightChange = true } else { $(".dzs-article-recom").hide(); } }, }); /**推荐企业号 */ if($(".store_flag").val() == 15){ $.ajax({ url: "/webapi/home/evip/getRecommendFollow", type: "get", success: function (res) { if(res.code == 0 && Array.isArray(res.data)){ var qyStr = '' for(var r = 0;r<res.data.length;r++){ var qyItem =res.data[r]; var jumpUrl = window.location.origin + '/d/c' + qyItem.apply_uid; var itemIcon = ''; var tagsArr = (qyItem.belong_to_industry || []).split(",") tagsArr = tagsArr.splice(0,3) var is_follow = qyItem.is_follow == 1?'focus':'unFocus' if(qyItem.ver_id == 1 || qyItem.ver_id == 2){ itemIcon= '/static/main/img/qyh/pro_vip_sm.png' }else if(qyItem.ver_id == 3){ itemIcon= '/static/main/img/qyh/enjoy_vip_sm.png' } else { itemIcon= '/static/main/img/qyh/common_vip_sm.png' } qyStr +='<li><a href="'+jumpUrl+'" target="_blank" class="block" >'; qyStr += '<div class="enterInfo">' qyStr += '<div class="enterImg">' qyStr += '<img src="'+qyItem.enterprise_head_url+'" class="companyImg objectFit"/>' qyStr += '</div>' qyStr += '<div class="enterDes">' qyStr += '<div class="name">' qyStr +='<img src="'+itemIcon+'" alt="">' qyStr +='<h5>'+qyItem.enterprise_name +'</h5>' qyStr +='</div>' qyStr +='<div class="companyName">'+qyItem.company_name +'</div>' qyStr += '<div class="tags">' for(var t = 0;t<tagsArr.length;t++){ qyStr += '<span>'+tagsArr[t]+'</span>' } qyStr += '</div>' qyStr += '</div>' qyStr += '</div>' qyStr += '<div class="industry">' qyStr += '<div class="view">' qyStr += '<span>'+qyItem.archives_count+'内容</span>' qyStr += '<span>'+ qyItem.view_count +'浏览量</span>' qyStr += '<span>'+qyItem.follow_count +'粉丝</span>' qyStr += '</div>' if(qyItem.is_follow == 1){ qyStr += '<span class="qyhFocus focus" data-qyId="'+qyItem.id +'"></span>' }else{ qyStr += '<span class="qyhFocus unFocus" data-qyId="'+qyItem.id +'">+关注</span>' } qyStr += '</div>' qyStr += '</a>' qyStr += '</li>' } $(".enterWrap-qyh").append(qyStr) } } }) //企业号关注和取消关注 $(".enterWrap-qyh").on("click",".qyhFocus",function(){ if($(".is-login").length>0 && $(".is-login").attr("data-uid")){ var hasFocus = $(this).hasClass("focus"); var qyId = $(this).attr("data-qyId") var that = $(this) $.post('/webapi/home/evipArticle/followEvip', { evip_id : qyId, action:hasFocus?'cancel':'follow' }, function (data) { //返回的数据格式： if (data.code == "0") { if(hasFocus){ that.removeClass("focus").addClass("unFocus").text("+关注") }else{ that.removeClass("unFocus").addClass("focus").text("") } }else{ alert(data.msg); } }); }else{ $.ssoDialogLogin(); } return false }) }else{ /**推荐专栏 */ $.ajax({ url: "/d/article/getZlList", type: "get", data: { type: "recommend", page: 1, size: 5 }, success: function (res) { if (res.code == 0) { renderColumn(res.data,""); rightHeightChange = true } else { $(".dzs-article-column").hide(); } }, }); } }) </script> <script src="https://staticd.elecfans.com/js/artilePartjs.js?20230906"></script> </body> </html>

搜索历史

终于有了！大规模中文NLP语料库！