道翰天琼AI正从“感知智能”走向“认知智能”全新时代正在来临。
证件、人脸,扫描对比,绿灯亮,通过,在经过高铁安检闸口的这一流程时,你也许会想:机器认识我。而实际上,并不是。
“当前的人工智能(AI)识别做的只是比对,缺少信息进入大脑之后的‘加工、理解、思考’步骤,因此仅仅停留在‘感知’,而并非‘认知’。”6月18日,纪念吴文俊诞辰一百周年活动的“认知智能行业应用大会”举行,中国人民大学高瓴人工智能学院执行院长文继荣表示,要让AI有类似大脑的活动,走到认知阶段,需要让它掌握知识、进行推理。AI从“感知智能”走向“认知智能”的实践目前在通用状态下比较困难,但在一些诸如反洗钱、侦察等领域正在应用。
AI“大脑”长成要先建知识库
“现在的AI处于弱人工智能状态,它没有大脑,要让它形成大脑,最核心的是要有‘知识’。”
微软亚洲研究院前研究员、北京一览群智数据科技有限责任公司首席执行官胡健表示,如果现有的算法、模型是神经或脑结构,那么知识是大脑能够运转起来的原动力。
让AI获得知识的知识库在业界称为“知识图谱”,它不仅要关注知识点还要关注知识点间的关联。这些关联将赋予AI联想力。“提到水,它要反应到密度、透明等多个性质,还要和浇水、能喝的功能联系起来,更高级的是计算出用多大力道去取水。”胡健说。
知识图谱的建立非常困难,人类海量的知识如何翻译成机器的语言,并与之建立联系,很成问题。尤其是之前这项工作一直是人工完成的,例如谷歌词库、百度百科、维基百科等都可以转换为知识图谱,但工作量大、内容异常庞杂。
“关联密度不足是另一个难以达到应用的‘瓶颈’。”胡健解释,一个知识点可能最多出现在几个关系中,能解决比尔·盖茨的爸爸的邻居的妈妈这种单维度的问题,但离反映现实世界中“蝴蝶效应”里的相互影响还差很远。
在关联密度不足的情况下,AI的“大脑”即便拥有一个上千万词条体量的通用知识图谱也难以达到应用的级别。
行业知识图谱能达“认知层面”
知识点的关联密度更像是一个AI大脑皮层,越复杂密集AI将越“聪明”。
“聚焦到行业,AI可以做到相对聪明一点。”胡健说,一些行业本身就有自己的基础关联图,这为其制定图谱提供了帮助。例如公安系统有一套体系,包括人、地、事、物、组织、机构以及关联,将出入境数据、第三方物流数据等加入进来之后,可固定成知识图谱。
中国人民公安大学公共安全行为科学实验室主任丁宁介绍,在做入室盗窃、公交扒窃等一些行为规律的研究时,知识图谱中除了引入历史数据的发展态势、风险感知之外,还逐步加入了环境、天气等数据,包括PM2.5的值,结果发现PM2.5的值对公交扒窃是有影响的。
“我们也提出虚实网络结合的方向,在掌握了实际的社交网,和资金流、社交流联系之后,我们对于团伙的刻画就比较准确了。”丁宁说,这将大大提高AI通过分析辅助决策的能力。
越密集越准确,AI知识图谱的关系图要做到像“福尔摩斯”一样综合分析,要形成凝集大量信息的知识图谱,这对传统的人工建立知识图谱的效率提出了挑战。“为此,我们研发出人工智能的解决方式,能够自动从海量的多源异构数据中抽取知识构建关系、理解语义以及与业务场景有效结合,更标准化、效率更高、关联密度能做到更高。”胡健说。
“在此基础上,我们研究出来跨境资金网络可疑交易的一套AI模型。”中信银行反洗钱专家沈可生说,它习得“认知智能”后每年的可疑交易预警量从50万份下降到10万份,减少80%人工甄别的工作量,同时把结果的准确度提升了80%。
认知智能是计算机科学的一个分支科学,是智能科学发展的高级阶段,它以人类认知体系为基础,以模仿人类核心能力为目标,以信息的理解、存储、应用为研究方向,以感知信息的深度理解和自然语言信息的深度理解为突破口,以跨学科理论体系为指导,从而形成的新一代理论、技术及应用系统的技术科学。 认知智能的核心研究范畴包括:1.宇宙、信息、大脑三者关系;2.人类大脑结构、功能、机制;3.哲学体系、文科体系、理科体系;4.认知融通、智慧融通、双脑(人脑和电脑)融通等核心体系。 认知智能四步走:1.认知宇宙世界。支撑理论体系有三体(宇宙、信息、大脑)论、易道论、存在论、本体论、认知论、融智学、HNC 等理论体系;2.清楚人脑结构、功能、机制。支撑学科有脑科学、心理学、逻辑学、情感学、生物学、化学等学科。3.清楚信息内涵规律规则。支撑学科有符号学、语言学、认知语言学、形式语言学等学科。4.系统落地能力。支撑学科有计算机科学、数学等学科。
接口申请官网地址:www.weilaitec.com
接口地址(例子):
http://a239p06512.zicp.vip/Web/BuAppJava.bujqrex?apikey="+apikey+"&msg="+msg+"&ip="+ip
用户端消息内容。
String msg ="你在干嘛呀?";
apikey参数。这个apikey就是网站上申请的APIKEY
apikey ="";
//客户端ip,最终用户端的唯一标识(可以是用户端的IP,或者手机设备号,或者微信号或者,qq号码等能证明身份的唯一标识就可以)
String ip ="";
//这里一定要encode转换编码。转成GBK。
msg = URLEncoder.encode(msg, "GBK");
三个参数全部小写
msg参数就是传输过去的对话内容。
msg参数要编码成gbk,不然会乱码。
接口具体代码:
package ai.nlp.jiekou.test;
import java.io.ByteArrayOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.UnsupportedEncodingException;
import java.net.HttpURLConnection;
import java.net.URL;
import java.net.URLEncoder;
import ai.nlp.util.changliang.ChangLiangZi;
public class ApiTest {
/**
* Get请求,获得返回数据
* @param urlStr
* @return
*/
private static String opUrl(String urlStr)
{
URL url = null;
HttpURLConnection conn = null;
InputStream is = null;
ByteArrayOutputStream baos = null;
try
{
url = new URL(urlStr);
conn = (HttpURLConnection) url.openConnection();
conn.setReadTimeout(5 * 10000);
conn.setConnectTimeout(5 * 10000);
conn.setRequestMethod("POST");
if (conn.getResponseCode() == 200)
{
is = conn.getInputStream();
baos = new ByteArrayOutputStream();
int len = -1;
byte[] buf = new byte[128];
while ((len = is.read(buf)) != -1)
{
baos.write(buf, 0, len);
}
baos.flush();
String result = baos.toString();
return result;
} else
{
throw new Exception("服务器连接错误!");
}
} catch (Exception e)
{
e.printStackTrace();
} finally
{
try
{
if (is != null)
is.close();
} catch (IOException e)
{
e.printStackTrace();
}
try
{
if (baos != null)
baos.close();
} catch (IOException e)
{
e.printStackTrace();
}
conn.disconnect();
}
return ChangLiangZi.WU;
}
public static void main(String args []){
//三个参数全部小写
//msg参数就是传输过去的对话内容。
//msg参数要编码成gbk,不然会乱码。
String msg ="你在干嘛呀?";
//apikey参数。
String apikey ="UTNJK34THXK010T566ZI39VES50BLRBE8R66H5R3FOAO84J3BV";
//客户端ip,最终用户端的唯一标识(可以是用户端的IP,或者手机设备号,或者微信号或者,qq号码等能证明身份的唯一标识就可以)
String ip ="127.0.0.1";
//这里一定要encode转换编码。转成GBK。
try
{
msg = URLEncoder.encode(msg, "GBK");
} catch (UnsupportedEncodingException e)
{
e.printStackTrace();
}
System.out.println(opUrl("http://a239p06512.zicp.vip/Web/BuAppJava.bujqrex?apikey="+apikey+"&msg="+msg+"&ip="+ip));
}
}