照亮黑暗的地质网

来自网络人乐天堂手机版类学
跳转到: 航行搜索
weo-geo-logo.jpg

这些是波特兰早间讲习班关于黑暗内容和地理网络的笔记。由保罗·比塞特领导,威戈首席执行官。fun88娱乐约有15人参加了会议,并提出了一些非常有趣的观点。

事件摘要

什么是geoweb的状态?其中一个主要问题是,相关信息被锁定,不被搜索引擎索引。我们称之为黑暗内容,因为它是不发光和不可搜索的。

有多少黑暗的内容?

  • 约800兆字节的数据目前无法在线搜索。
  • ~91000兆字节不可访问。不需要搜查,无索引数字内容。

那是什么意思?这意味着,我们在网上收集和存储的数字知识中,只有不到百分之一不可供我们使用。

这意味着没有索引,没有搜索,而且没有协同使用这些内容,因为它没有被索引,这使得它成为所有参与访问的人的巨大生产力下降,验证并从可用的有限来源收集数据。只是装备比较差,可以做出不知情的决定。我们能做什么?

事情需要被索引

比如说我们想买房子,但我们要确保在安全的地方买房子。你可以看一张有地震带的地图,一个是海啸区,你甚至可以覆盖所有这些地图来查看数据的交叉点。这些是信息层。

但想象一下,你做的每一个决定都是这样。你做的每件事都有图层图,无论你做什么选择,现在,如果你决定去星巴克,这可能没什么关系,fun88娱乐但是当你决定把水净化厂建在哪里时,或公园或娱乐系统,这变得非常重要。我们该怎么做?

好消息是自从Google Earth发布以来,地理变得很酷。

但使用数据是一回事,另一个问题是,这些数据集大部分不是基于文本的。它们需要一系列信息解包协议来将它们分解为可用的内容。

你需要工具才能做到这一点。你可以找到一个文件,但是你也必须能够进入其中,在数据周围还有决策过程。每个文件都不同,这就是为什么很多东西都在黑暗中。当数据如此分离并卡在筒仓中时,处理系统就变得和数据一样重要。没有元数据标准/标准至少允许对不同的数据和内容进行交叉索引。这对于共享数据处理至关重要。

现有的元数据标准很繁琐,使用/解密的动机有限,数据集的可扩展性也有限。大数据集很难分解成可用的块。

数据的开放性基于不同的文化。政府数据与MySpace有着不同的文化。一家公司有权创造某种东西,而且获取它是非常昂贵的。

所有的数据都应该是可共享的,这样人们就可以在彼此的工作基础上进行构建。

还可以看到:在哪里