W3C中国

W3C Blog: Web数据的未来方向

2017年6月27日,W3C的Phil Archer撰写博客文章,阐述了对Web数据未来方向的思考。文章大意如下:

基础

2017年1月,Web数据最佳实践(Data on the Web Best Practices)成为W3C的正式推荐标准,这构成了W3C在Web数据(Data on the Web)的基础,给出了在Web上公开或非公开共享数据的基本流程,鼓励在Web共享数据的同时不只是给出可下载的数据集,还提供更多关联信息。我们还给出了一个领域相关的最佳实践:Web空间数据最佳实践(Spatial Data on the Web Best Practices),强调在Web上公开数据,并为搜索引擎提供支持。这样,我们可以象使用U盘一样,使用Web上可下载的数据资源。

 

空间数据(Spatial Data)

这是Web空间数据工作组给出的一份领域相关的最佳实践,W3C与开放地理联盟(OGC)共同合作发布。W3C还将继续和OGC保持长期合作,在WebVR/AR、物联万维网(WoT)、信息模型、对地观测等领域制定联合数据标准。

 

研究数据(Research Data)

另一个方向是与生命科学、空间探索、海洋科学、地学、材料科学等结合开发研究数据的本体。在欧盟VRE4EIC项目的支持下,W3C设立了数据集交换工作组(Dataset Exchange WG,DXWG),满足这类需求带来的挑战,并与研究数据联盟(Research Data Alliance)CODATA以及联合国相关机构保持密切沟通与合作。这些工作与政府数据公开的努力并不冲突,政府数据共享同样也是 DXWG 工作组的需求来源之一。如果该工作组能达成章程的约定,将为跨越不同领域和社区的数据集共享带来巨大的进步。

 

互联数据(Linked Data)

互联数据的应用越来越广泛。如果我们接受Gartner的炒作曲线(Hype Cycle)模型,我们相信互联数据已经进入了持续增长的区域(Slope of Enlightenment)。我们看到互联数据在生命科学、政府数据及遗产保护领域的应用,并成为跨越组织边界共享数据的有效手段。但是,让广大的Web开发者使用 SPARQL 端点来开发Web应用仍然是不切实际的。更进一步,即便所有的SPARQL端点都可以开放使用,SPARQL查询带来的巨大计算复杂度仍会让系统瘫痪。这是为什么 BBC、OpenPHACTS及其他机构不愿意对公众开放其 SPARQL 端点的原因。取而代之,他们更倾向于开放一个简单的 API,在后台执行更直接的查询。在BBC,即便这样的API也不是对公众开放的,但这个API驱动了很多BBC网站上的内容。

这一情况好的一面是,我们可以通过一种对开发者更加友好的、JSON对象的方式来访问互联数据。从数据发布者的角度看,这种API更加稳定和可靠。但不好的一面是,人们会忽视和忘记在简单API背后的互联数据架构,这会使大家不断质疑互联数据的价值。

 

语义Web、人工智能与机器学习(Semantic Web、AI and Machine Learning)

我们在2014年初更新了语义Web相关的主要技术规范,之后并没有进一步计划来审阅核心的RDF和OWL。但是,这并不意味着在这些语义Web的核心方面我们已经无事可做。

一个急需得到更新的技术工作是JSON-LD。相关的社区组已经开发了后续规范的草案,现在需要将这些更新纳入到未来的推荐标准的流程中。同时,Shapes约束语言(SHACL,Shapes Constrain Language)目前已经推进到提案推荐标准,得到了许多关注和参考实现。

但我从技术社区中得到的反馈是,语义网应当进一步发展并支持所谓的“标注三元组(annotated triples)”。RDF在描述不断改变的动态内容是存在天然的不足:如不断改变的工作机会、音乐会的票的状态会失效、全球平均气温不断变化等。此外,所有的“事实”并不具有相同的信任度(confidence)。自然语言处理中,如果有75%的可能性就可以认为是事实。

用RDF中的命名图(Named Graphs)可以表达这些需求,但仍有很强的需求来向RDF扩充validFrom, validTo以及probability 来表达这些需求。其他可能的标注还可包括隐私、数据溯源等。这些对三元组的标注在语法上等价于创建和标注一个命名图,RDF 1.1一直沿着这个方向走。但一个更简化的语法将使这个过程更加容易。这对于AI、深度学习、统计分析等需求非常重要。

这些方向正在ESWC中讨论,我们希望在明年组织 W3C技术研讨会,并致力于推动设立新的工作组。目前,一个项目建议已经提交给欧盟委员会,来支持这个方向的探索。

在语义Web方向的其他探索还包括建立一个公共的词汇表来共享数据分析、自然语言理解等方面的交换需求,自然语言交换格式(Natural Language Interchange Format)目前正在进入W3C标准流程。

 

词汇表与 Schema.org 

不同的技术社区维护了各类通用词汇表,其中重要的问题是实现词汇表的互操作。一个简单易于维护的词汇表、互联是一个重要方向。目前,W3C的社区组中聚集了许多人,正在开发不同的schema,可以在 www.w3.org/ns 中查询。我们需要更好的工具来支持这个过程。

W3C将支持 schema.org 的开发,将其转换成web页面中嵌入的更多结构化数据。如果您希望加入 schema.org 的开发中,请参阅社区组的讨论,及 [email protected] 邮件列表的讨论。

 

总结

1. 继续加强与OGC的合作,为Web上的地理空间信息系统提供更好的互操作性;

2. 与研究数据社区建立更紧密的联系;

3. 探索对RDF三元组的标记(annotating)方法,如增加时态或模糊支持;

4. 更好的支持词汇表的开发及维护;

5. 持续提升基于互联数据/语义Web的数据集成方法,并提供更加鲁棒的 JSON API。

更多内容,请参阅英文原文,及其他W3C官方博客文章

W3C发布结构性约束语言(SHACL)提案推荐标准 征集审阅意见

2017年6月8日,W3C的RDF数据结构性工作组(RDF Data Shapes Working Group)发布结构性约束语言(Shapes Constraint Language)即SHACL的提案推荐标准(Proposed Recommendation)。SHACL(结构性约束语言)是一种依据一组条件来验证RDF图的语言。这些条件是作为以RDF图表示的其他结构体(constructs)或结构性(shapes)提供的。在SHACL中,以这种方式使用的RDF图被称为“结构性图”,依据结构性图验证的RDF图被称为“数据图”。除了可用于验证外,这种描述还有多种不同用途,例如用于用户界面构建,代码生成以及数据集成等。

欢迎您于2017年7月6日前,提交您对于该文档的审阅意见。更多内容,请参阅英文原文

 

W3C发布OWL中的时间本体(Time Ontology in OWL)候选推荐标准 征集参考实现

photo2017年6月6日,W3C的Web时空数据工作组(Spatial Data on the Web Working Group)发布OWL中的时间本体(Time Ontology in OWL)候选推荐标准(Candidate Recommendation)。本体提供了一个词汇表,表达关于时间与间隔之间拓扑(排序)关系的事实,提供了关于持续时间的信息,以及包括日期时间信息在内的时间位置。时间的位置和持续时间可以使用常规(公历)日历和时钟表示,或者使用其他的时间参考系统,例如Unix-time,地质时间,或是不同的日历。

更多内容,请参阅英文原文

W3C发布面向时空数据的RDF数据立方扩展(QB4ST)的工作组备忘

2017年4月18日,W3C与开放地理空间联盟(Open Geospatial Consortium,OGC)联合设立的Web空间数据工作组(Spatial Data on the Web Working Group)发布了QB4ST的工作组备忘。QB4ST为RDF数据立方(RDF Data Cube)提供了面向时空数据表示的扩展组件。这些扩展使共享和处理诸如对地观测(earth observation)等通过时间和空间属性链接不同数据片(slices)变得更加容易。

更多内容,请参阅英文原文。 

W3C发布Web空间数据最佳实践(Spatial Data on the Web Best Practices)

2017年3月30日,W3C的Web空间数据工作组(Spatial Data on the Web Working Group)发布了Web空间数据最佳实践(Spatial Data on the Web Best Practices)的工作组备忘(Group Note)。该文档给出了一组在Web上发布和使用空间数据,及基于Web技术提供位置相关服务的应用场景和案例。最佳实践文档希望为 Web开发者、地理空间技术专家提供一组经过整理的真实的应用。这些最佳实践与传统空间数据基础设施的不同是,它们采用了互联数据(Linked Data)的方法,并将地理位置(locations)作为跨越多个数据集相互连接的关键因素,同时,空间数据也扩充了互联数据的范畴,并提供了对5星级互联数据模式的支持。这是对2017年2月16日版本的更新。
 

更多内容,请参阅工作组主页,及英文原文。 

W3C发布Web空间数据最佳实践(Spatial Data on the Web Best Practices)

2017年2月16日,W3C的Web空间数据工作组(Spatial Data on the Web Working Group)发布了Web空间数据最佳实践(Spatial Data on the Web Best Practices)的工作组备忘(Group Note)。该文档给出了一组在Web上发布和使用空间数据,及基于Web技术提供位置相关服务的应用场景和案例。最佳实践文档希望为 Web开发者、地理空间技术专家提供一组经过整理的真实的应用。这些最佳实践与传统空间数据基础设施的不同是,它们采用了互联数据(Linked Data)的方法,并将地理位置(locations)作为跨越多个数据集相互连接的关键因素,同时,空间数据也扩充了互联数据的范畴,并提供了对5星级互联数据模式的支持。

更多内容,请参阅原文。 

W3C发布 XLST(3.0版)的候选推荐标准 征集参考实现

2016年2月7日,W3C的XML样式转换工作组(XSLT Working Group)发布了XSL转换(XSL Transformations,XSLT)的3.0版候选推荐标准(candidate recommendation)。该规范定义了XSLT 3.0的语法和语义。XSLT是一个XML文档格式转换的语言,定义从一个XML文档格式转换到另一个XML文档格式的转换规则,XSLT语言的转换采用良构的XML格式的样式单(Stylesheet)方式定义。
 

XSLT 3.0是 2007年1月23日发布的XSLT 2.0的修改版本。这一版本的主要更新是,支持基于流方式(streaming mode)的转换过程,源文档及目标文档并不需要完全加载到内存中,从而提高内存利用效率;此外,另一处重要的更新是允许,提升对复杂转换规则的模块化,允许XML的样式单基于一些独立的、开发好的组件基础上进行定义,获得软件工程上更好的鲁棒性。
 

更多信息,请参阅XSLT工作组主页,及英文原文。 

W3C发布Web数据最佳实践(Data on the Web Best Practices)的正式推荐标准

data on the web best practice2017年1月31日,W3C正式发布了Web数据最佳实践(Data on the Web Best Practices)的正式推荐标准。该文档提供了35个用于在Web上公开或非公开地共享各种(政府、科研、商业等)数据的最佳实践(Best Practices)。其目标是实现数据智能,进而最大化数据发掘与重复使用的可能性。将URIs用作为标识符和多址接入选择项是提供各种各样元数据的关键,提供了与Web数据出版及使用相关的最佳实践。Web数据本身应该能够被发现和检索,并被人类和机器所理解。数据也有很多种用途,不仅可以被数据的拥有者使用,也可以被外部第三方使用。数据在何处以某一方式被哪一方所使用也应当能够被发现和检索,这也是公认的数据发布者的努力。遵循这些最佳实践将促进数据发布者(publisher)与使用者(consumer)之间的互操作。

W3C还同时发布了支持这一技术的两份词汇表,分别覆盖数据使用(Data usage)数据质量(Data quality)。这两份词汇表于2016年完成,也是即将完成的其他空间数据标准工作的基础。更多背景信息,请参阅相关博客文章W3C Blog:Data on the Web, Here is How。 

W3C与OGC继续关注Web空间数据共享 发布传感器网络本体等4份技术文档

2017年1月5日,W3C与开放地理空间联盟(Open Geospatial Consortium,OGC)联合设立的Web空间数据工作组(Spatial Data on the Web Working Group)发布了4份技术标准草案:

QB4ST:这是一份W3C的工作组备忘,QB4ST为RDF数据立方(RDF Data Cube)提供了面向时空数据表示的扩展组件。这些扩展使共享和处理诸如对地观测(earth observation)等通过时间和空间属性链接不同数据片(slices)变得更加容易。

使用RDF数据立方和全球离散网格系统发布和使用对地观测数据(Publishing and Using Earth Observation Data with the RDF Data Cube and Discrete Global Grid System):这是一份W3C 工作组备忘,该文档展示了如何利用 SPARQL 查询,通过 OGC 开发的全球离散网格系统及一个观测元数据三元组存储库,来使用对地观测数据。这一方法借助Web互联数据(Linked data on the web),但并不需要所有的数据都采用 RDF 元组的方式存储和表达。

传感器网络本体(Semantic Sensor Network Ontology):这是该工作组最新的标准工作草案,该文档给出了一种模块化的方法并保持与已有词汇表的一致性。这种模块化的体系结构为不同领域(如卫星图像、大规模科学观测、工业和家用基础设施、民生服务,及万维物联网(Web of things)等的应用灵活扩展本体提供了支撑。

Web空间数据最佳实践(Spatial Data on the Web Best Practices):该文档给出了一组在Web上发布和使用空间数据的案例和最佳实践。目前这份文档以工作组备忘的形式发布。
 

更多内容,请参阅W3C的Web空间数据工作组

 

W3C发布Web数据最佳实践(Data on the Web Best Practices)的提案推荐标准

2016年12月15日,W3C的Web数据最佳实践工作组(Data on the Web Best Practices Working Group)发布Web数据最佳实践(Data on the Web Best Practices)提案推荐标准,并征集审阅意见。该规范在数据集使用词汇表(Dataset Usage )数据质量词汇表(Data Quality)两份工作组备忘(group note)的补充下,给出了数据发布者如何通过利用互联网最大化地分享Web数据。这些最佳实践覆盖了数据使用许可(licensing)、数据溯源(provenance)、数据访问API、数据集的身份标识(identifiers)、对数据集的反馈(feedback)、数据的丰富与扩展(enrichment)及数据保护等诸多方面。
 

Web数据最佳实践工作组已经编辑了一份实质性实现报告,这份报告展示了包括政府、科研、文化等诸多领域都遵循这份最佳实践。这三份文档旨在进一步开发一个动态的生态系统,在这个生态系统中,数据可以被发现、理解、评估、重复使用,并且重复使用也是被认可的。欢迎您于2017年1月15日前,提交您对该文档的审阅意见。

更多内容,请参阅英文原文

W3C发布互联数据通知(Linked Data Notifications,LDN)的候选推荐标准

2016年11月1日,W3C的社交Web工作组(Social Web Working Group)发布互联数据通知(Linked Data Notifications,LDN)候选推荐标准,征集参考实现。LDN不但描述了在用户界面或者自动化流程中,应用程序(发送方)如何将消息推送给服务器(接收方),而且还描述了其他应用程序(消费者)如何检索这些消息以供使用。任何资源(例如博客文章,或者用户配置文件)都可以通知以该资源为目标消息的某个接收端点(收件箱)。消息本身是用RDF表达的,并且可以包含任何数据。LDN实现可能是发送者、接收者或者是消费者。现有的互联数据平台(Linked Data Platform, LDP)实现已经是符合LDN要求的接收者 - 一个LDN收件箱只是一个LDP容器。我们欢迎来自开发者社区(特别是之前互联数据平台LDP的实现者的测试用例及可实现性测试报告)。

更多内容,欢迎访问英文原文,及W3C的社交Web工作组

W3C发布Web空间数据用例与需求、最佳实践的工作草案

2016年10月25日,W3C的Web空间数据工作组(Spatial Data on the Web WG),与OGC联合发布了两份文档:

Web空间数据用例与需求(Spatial Data on the Web Use Cases & Requirements):介绍了工作组所识别的标准工作边界、用户场景及标准化需求。

Web空间数据最佳实践(Spatial Data on the Web Best Practices): 该文档在Web数据最佳实践(Data on the Web Best Practices,目前处在候选推荐标准阶段)的基础上,给出理想的空间数据共享与现实情况之间的差距分析,使Web能更好地支持地理空间系统及基于位置的传感,并更好支持空间数据以外的其他数据在Web上的共享。

尽管W3C的空间数据工作组主要由地理空间技术专家驱动,但工作组也非常欢迎这一领域以外的其他Web技术社区的专家加入和参与。更多内容,请参阅英文原文,及W3C的空间数据工作组。 

站内搜索

万维网联盟(World Wide Web Consortium, W3C)是Web领域的国际标准化组织,致力开发开放Web标准确保Web的长期发展,实现“尽展Web无限潜能”的使命。

更多内容>>

近期活动

更多内容>>

W3Cx 开放课程

W3C技术标准

查看Web技术标准
- 所有标准
■ Web与产业融合 ■
- 汽车 | 数字出版 | Web与电信
- 娱乐与广播电视 | Web支付 | Web数据
- 物联万维网(WoT) | Web安全
■ Web For All ■
- Web无障碍 | 国际化 | 索引(A to Z)
■ 社区组与商务组 ■
- 所有社区组 | 新建社区组
■ 标准工作组 ■
- 所有标准小组 | 参与指南

更多内容>>

W3C标准翻译

欢迎您加入W3C翻译计划,了解W3C标准和文档翻译情况,帮助提供不同语言的W3C标准规范及文档的志愿者翻译及W3C授权翻译,惠及全球技术社区。

更多内容>>

贡献榜

我们通过贡献榜,感谢您积极参与W3C的标准制定及审阅工作、提供标准及技术文章的中文翻译、参与各类技术研讨会。

更多内容>>

W3C 中文开发者社区

W3C中国目前正在不断加大全球W3C工作的参与力度,并推动了一系列以了解中国行业需求、引导标准制定为主要目的的工作组(WG)、兴趣组(IG)和社区组(CG)。
Web中文兴趣组 | MiniApps工作组 | MiniApps生态社区组 | 弹幕特别任务组 | 中国信息无障碍社区组 | 中文数字出版社区组 | 数据可视化社区组 | 中文文字布局需求特别任务组

更多内容>>

会员链接

相关资源需要使用 W3C账号登录后使用

首页 | 加入工作组 | 申请W3C账号 | 最新会员消息

开发者资源

合作伙伴

  • 北京航空航天大学
  • 北航计算机学院
  • w3ctech