所需的所有属性

A collection of data related to the UK.
Post Reply
roseline371274
Posts: 568
Joined: Mon Dec 23, 2024 3:21 am

所需的所有属性

Post by roseline371274 »

雪花 - 模型
除了仓库之外,所使用的数据模型也对性能有很大影响。多年来,星型模式一直是设计 BI 数据模型的方法。我们将这条路径留给我们的仪表板。

创建一个大表
根据事实和周围的维度创建一个表。为此,选择仪表板(或多个仪表板)(测量值 委内瑞拉 数字数据 和维度属性)。将其保存在 1 个表中,即“一个大表”。这是包含信息区域所有信息的一张表,因此没有单独的维度表。

在 Snowflake 中我们可以通过定义动态表来实现这一点。这是一种由 Snowflake 物理写入数据库的数据库视图。但当然也可以为此创建一个 ETL 流程。

然而,有时除了“一个大表”之外,可能还需要创建其他表。这些表是维度的小子集,例如在以下情况下需要它们:
优化性能较差的选择器或使用不区分大小写的搜索功能。
链接一个报告页面上使用的多个事实表,这些事实表不能合并为一个大表。
自定义生成器。 除了创建一个大表之外,在 Snowflake 中 定义一个物化视图也很有趣, 其中来自一个大表的数据在聚合级别上进行计算。如果您的仪表板包含详细信息页面,但也显示每月的信息,那么这可能是一个有用的选项。 如果对于相关的报告页面来说足够的话, Snowflake 将自动使用来自物化视图的聚合信息 。这可以进一步提高性能。
聚类键。 这决定了数据存储的排序。通过将聚类键放在仪表板上的选择器上,Snowflake 将能够更快地提供所请求的数据选择。对聚类键中字段的顺序进行试验。
Snowflake 中的所有逻辑。 理想情况下,您只需要对 Power BI 中的列执行类似 SUM 的计算。这可确保 Power BI 中仅请求报告所需的数据。为了给用户提供最佳性能,有时需要仔细考虑这一点,例如:
尽量避免平均值等等。
在 OBT 中为仍然在 Power BI 中应用固定过滤器的每个度量创建一个额外的列。
在 Power BI 中减去列时,请将该计算包含在“一个大表”中。


Power BI - 语义层
在 Power BI 中,也有多种方法来实现解决方案,您在此处做出的选择将影响仪表板的性能。

限制连接。
当有许多连接时,查询时间会迅速增加。因此,请尽量避免连接,例如每页使用一个大表。
双重尺寸。
如果您使用(选择器)维度,请使用“双重”存储类型。 Dual 将适当的维度值预先导入 Power BI,并产生比 Direct Query 更好的结果,即使整个查询是在 Snowflake 中执行的。例外的是包含个人数据(例如员工)的维度,根据 GDPR,这些数据只能由授权用户读取。对于导入的数据,不再可能根据用户角色来屏蔽数据。
Post Reply