Discuz! Board

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 57|回复: 0

大数据能刺激语义网开发吗?

[复制链接]

1

主题

1

帖子

5

积分

新手上路

Rank: 1

积分
5
发表于 2023-7-17 12:27:53 | 显示全部楼层 |阅读模式
语义网或 Web 3.0 通常被称为互联网的下一阶段。由万维网联盟(W3C) 领导,目标是将当前的非结构化和半结构化数据网络转变为“数据网络””。
语义网或 Web 3.0 通常被称为互联网的下一阶段。由万维网联盟(W3C) 领导,目标是将当前的非结构化和半结构化数据网络转变为“数据网络”。根据 W3C 的说法,通过语义网络,可以轻松地跨应用程序、社区和企业边界共享和重用数据。

网络的发明者蒂姆·伯纳斯·李称1998 年的语义网已经是“一个数据网络,在某些方面就像一个全球数据库”。该数据库将包含当前已在线但仍驻留在网络孤岛中的所有非结构化、半结构化和结构化数据。在同一篇论文中,他将开发语义网的基本原理描述为“网络被设计为一个信息空间,其目标是它不 购买电子邮件数据库 仅对人与人的交流有用,而且使机器能够参与和帮助。实现这一目标的主要障碍之一是,网络上的大多数信息都是为​​人类消费而设计的,即使它是从其列具有明确定义的含义(至少在某些术语中)的数据库中导出的,对于浏览网络的机器人来说,数据结构并不明显”。

因此,语义网将使所有人以及所有互联网连接设备(想想:物联网)能够相互通信,并在不同的应用程序和组织中以不同的形式实时共享和重用数据。显然,这与大数据息息相关。然而问题是,大数据及其技术能否刺激语义网的发展。



大数据通常被讨论为容量、速度和多样性的 3V。我个人认为这太短视了,因为它忘记了大数据的其他一些非常重要的方面:准确性、价值、可视化和可变性。准确性是指数据的正确性。价值是公司、组织和社会的经济效益。可视化是使数据变得简单易懂的艺术。变异性是数据随着时间的推移而变化的含义。

更多阅读
图像
Grover:语义英语的商业语法
规模、结构和语义
万亿三重语义数据库
新年快乐:语义网的未来(第 2 部分)
语义网,第五部分:做好准备
这 7V 一起定义了大数据,它立即显示了语义网络的挑战:如何连接、链接和提供网络上高速、大量、不同种类和可变性创建的所有数据,确保正确性和质量并使其能够被人类和机器理解。它还展示了大数据如何帮助创建语义网。目前正在为大数据开发的所有技术,例如 Hadoop、开源工具或大数据初创公司开发的技术,随着处理、链接和分析所有数据变得更好、更便宜,将促进语义网的发展。

拉玛尼·潘杜兰甘介绍为“本质上是一个框架,用于链接存储在网络上不同数据库中的数据的元数据(有关数据的数据),以便机器能够查询这些数据库并产生丰富的结果。” 当目前仍处于网络孤岛中的所有数据库都将被连接起来时,机器将有可能找到当前难以或不可能找到的信息,并与该信息进行连接和通信。

一个很好的例子是Google 的知识图谱,它于 2012 年 5 月推出。Google 称其为搜索的未来,对事物而不是字符串进行索引。知识图谱非常有前途,但正如Larry Page 所提到的,它们“仍处于 Google 想要达到的目标的 1%”。目前,Google 创建的语义网络包含5.7 亿个对象和超过 180 亿个有关不同对象之间关系的事实,用于理解搜索时输入的关键字的含义。目标是开发 Startrek 体验,用户可以简单地向计算机提出自然问题。


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|DiscuzX

GMT+8, 2024-9-17 13:35 , Processed in 0.018877 second(s), 18 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表