请选择 进入手机版 | 继续访问电脑版

人工智能论坛

 找回密码
 立即注册
查看: 2547|回复: 6

一个关于自然语言处理案例 的讨论

  [复制链接]
发表于 2013-5-18 14:11:59 | 显示全部楼层 |阅读模式
最近参与一个项目,其中的一个工作是地名的归一化处理问题。
我描述一下问题:有N个文本,每个里面有M个文本片段,每个片段中有一个关于组织机构的描述,数据量比较大大概是千万级别,这样有些机构的名称可能会重复,但是不能保证这些描述是一模一样的例如:华中师范大学应用数学系,华师应用数学系,这两个其实描述的一个东西,但是计算机处理的时候不知道这两个关系,程序在处理之后希望这样的名称是能够合并的。欢迎做过类似工作或者对自然语言处理有研究的同志们踊跃发表你们的意见,大家一起讨论这个问题,哪怕一点思路或者一个意见都是很宝贵的,欢迎大家踊跃发言。
回复

使用道具 举报

发表于 2017-6-27 22:31:20 | 显示全部楼层
这个只能人工处理,因为涉及语义问题,华中师范大学与华师并不存在唯一对应关系,人类在处理这类问题时也要有更多的信息进行查证或排除其它可能
回复 支持 1 反对 0

使用道具 举报

发表于 2013-8-16 00:07:17 | 显示全部楼层
回复 支持 反对

使用道具 举报

发表于 2013-9-3 20:46:30 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

发表于 2013-9-13 02:45:20 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

发表于 2013-10-1 06:48:37 | 显示全部楼层
好贴,绝对要支持下!!~~












棉先生
回复 支持 反对

使用道具 举报

发表于 2013-11-12 16:09:27 | 显示全部楼层
不错啊! 一个字牛啊!











准备去日照旅游,有一起的嘛?日照旅游_日照旅游攻略_日照旅游景点_日照渔家乐_日照酒店预订_全国特色旅游网 http://www.qgts.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|积分充值|小黑屋|手机浏览|人工智能实验室 ( 苏ICP备12079930号

GMT+8, 2017-12-16 19:14 , Processed in 0.174012 second(s), 25 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表