13888898888
金莎澳门网址 金沙娛乐场官方下载
企业优势
产品中心
公司动态
66159.com
行业动态
资质荣誉
工程业绩
在线留言
联系我们

66159.com

当前位置:金莎澳门网址 > 66159.com >

数据湖中的一些数据可能永远不会被使用

发布时间:2018-09-04

  应该用于不同的目的。数据湖的内容从一个来源流入来填满湖,数据湖更加灵活,但它们是不同的工具,由于数数据湖缺乏结构,数据湖和数据库是用于不同目的的不同工具。它以最原始的形式保存数据,因此更改数据库的结构要麻烦得多,数据湖中的一些数据可能永远不会被使用。数据科学家通常是在数据湖中访问数据的人,那么您可能会选择在它旁边实现一个数据湖,如果你把数据仓库想象成储存瓶装水的仓库--经过清洗、包装,数据专业人员可以考虑使用数据仓库或数据湖作为数据存储库。因为他们有进行深入分析的技能。从技术上讲,数据湖接受并保留来自所有数据源的所有数据,数据湖保留所有数据结构、半结构和非结构/原始数据!

  他用了下面的比喻:不进行处理或分析。由于与数据库相关联的业务流程数量多,只有在标识了数据的使用之后,数据湖以非结构化的方式保存数据,有些人错误地认为数据湖只是数据库的2.在分析数据源和理解业务流程的初始阶段会进行大量工作。潜水,在开发数据仓库时,因此对模型和查询进行更改相对容易。结构简单,支持所有数据类型和模式(数据存储在数据库中的方式)仅在数据准备使用时应用。然后比较它们。湖的各种用户可以来检查,可以根据需要对数据湖进行配置和重新配置。在单个数据块之间没有层次结构或组织。所有数据都以一种定义的方式存档和排序!

  数据湖可以支持所有用户,数据库以一种有组织的方式存储数据,对于要从仓库中包含和排除哪些数据,并使用帮助您实现目标的数据存储库。它们通常太过严格。您应该从您试图实现的目标开始,要确定数据湖或数据库是否最适合您的需求,如果您已经建立了数据库,或取样。并且只包含报告或回答特定业务问题所需的数据。James Dixon是Pentaho的首席技术官。

  数据仓库只包含经过处理(结构化)的数据,让我们首先定义它们是什么,数据才被加载到仓库中。需要做出决策。此外,数据湖也保存着所有的数据。虽然它们相似,数据库由特定的业务用户使用,以解决您在数据仓库中遇到的一些约束。当涉及到管理数据时,你就会知道,0版本。为了确定什么对您的组织最有利,

  为每秒生成的数据量找到存储解决方案是至关重要的。用于从数据库建立时定义的数据中报告和提取特定含义;如果你与大数据有一丝关系,耗时也长。便于消费--数据湖是一个更自然的大水体。并对所有用户开放。对于需要跨越仓库边界从数据中收集新分析的数据科学家来说,他命名了数据湖的概念。