大数据助攻CP 胡歌霍建华身价紧相连

来源:中国日报网
2015-12-25 09:24:01

综艺节目的网络化海淘留下的便是这些繁杂的交叉数据维度,对于分析师和技术人员来说,无疑要将维度定义否定再否定,直至寻找到最为科学的数据维度以及大数据可视化呈现。于是就有了再改就剁手再改就切腹再改就剁手+切腹的豪言壮语,以及迫不得已的食言所导致的灵魂上的残缺。

大数据是怎样炼成的

对于一众看客来说,大数据这个字眼也许并不生疏,但是它具体是如何炼成的,想来我们未必完全知晓。

大数据是一种既定的存在,你知与不知,它就在那里,每日都在积累成长;你了与不了,它的生成,就是芸芸众生每一个动作的产物;只不过在有谁站出来梳理出它的逻辑之前,我们很难发现它的价值所在。而像艾漫数据这种企业的工作,就是给予大数据一个秩序化、并从中挖掘出价值的过程。

这个过程被艾漫这些极具社会主义艺术与人文气息的技术达人与分析师们归纳为两个部分:代表科技的大数据挖掘技术与自然语言理解技术,以及代表艺术的娱乐行业背景知识,科技与艺术水乳交融,产生化学裂变形成了娱乐白皮书。

如腾讯的混沌之作,在其数据的抓取层面大致可能分为以下几个步骤:

首先,对数据进行多维度和多层次的建模与计算,在娱乐知识图谱的基础上深度挖掘各种娱乐对象并洞察娱乐行业发展态势。这是一个对互联网信息进行全方位获取的过程。这包括了对历史数据的追踪以及掌控这些数据的历史规律从而寻找其中的变化趋势。

这种数据的抓取,相较传统的类似抽样调研的模式来说,有两个优势:根据实际需求随时调整抓取的数据维度,以及灵活制定个性化的分析维度,从而得以展现更加丰富的大数据分析结果。

其次,是借助人工智能技术和机器学习算法来深入理解被获取到的文本的语义,并采用分类、聚类、抽取技术,深度挖掘标的物的内涵和外延,深度探索其中的语义关联。

以艾漫数据的做法为例,传统公司一般采用关键字过滤的方式实现对目标实体的监测,为了提高数据匹配准确度,你可能会为标的物添加限定词,但是这种方式会漏掉大量的数据,无法保证召回率。而艾漫可以做到深度探索对象之间的关联,并理解文本,做到真正认知,而不再是简单的关键字匹配。

利用分布式架构,使自然语言处理算法轻松应对海量数据并实现高效分析;这项技术确保了娱乐对象的精准识别,能够保证所有分析维度精准对应到娱乐对象。

——岳耀彪,艾漫数据平台部经理

大数据的出现,在本质上虽然由来已久,但就好比宇宙中无序的混沌与无边的黑暗,一直未有泰坦出现,无人耕耘。而像艾漫数据如今正在从事的,将之理解为以娱乐产业的变革者与先行者,也就不为过了罢。

盘古创世,以眼做日月,由此,世界便有了光明。

关于艾漫数据

写到这里,我们想添些笔墨给艾漫,一是对于帮我们解读腾讯大作背后的那些繁杂工作的艾漫表示感谢;二是八一八这家成立仅3年的企业,缘何对大数据缘何如此门儿清。

它用数据全程支持今年这部腾讯娱乐大作《混沌之后,伟大之前》,也是2014年《腾讯娱乐白皮书》的独家数据合作方;2014年安徽卫视《国剧盛典》数据支持;2014年《南都娱乐周刊》盛典数据支持;2015年东方卫视《风从东方来》数据支持;并为《无问西东》、《心花路放》、《深海挑战》、《小时代》等电影提供数据支持。

上一页 1 2 3 4 下一页

标签: