第16节(2 / 2)

唐念据提示登服务,数据是从74万篇中医古籍中采集来的65万药材,里面有很多别名、错名、重复等干扰项,需要先删除重复、冗余或噪声数据,再人工标注并对数据行归类。

唐念以前过机学习方面的比赛,懂得归类问题的基本步骤,一般先是建立词汇表,

Loading...

内容未加载完成,请尝试【刷新网页】or【设置-关闭小说模式】or【设置-关闭广告屏蔽】~

推荐使用【UC浏览器】or【火狐浏览器】or【百度极速版】打开并收藏网址!

举报本章错误( 无需登录 )