所需的所有属性

roseline371274 · Post by **roseline371274** » Sun Mar 23, 2025 4:44 am

雪花 - 模型
除了仓库之外，所使用的数据模型也对性能有很大影响。多年来，星型模式一直是设计 BI 数据模型的方法。我们将这条路径留给我们的仪表板。

创建一个大表
根据事实和周围的维度创建一个表。为此，选择仪表板（或多个仪表板）（测量值委内瑞拉数字数据和维度属性）。将其保存在 1 个表中，即“一个大表”。这是包含信息区域所有信息的一张表，因此没有单独的维度表。

在 Snowflake 中我们可以通过定义动态表来实现这一点。这是一种由 Snowflake 物理写入数据库的数据库视图。但当然也可以为此创建一个 ETL 流程。

然而，有时除了“一个大表”之外，可能还需要创建其他表。这些表是维度的小子集，例如在以下情况下需要它们：
优化性能较差的选择器或使用不区分大小写的搜索功能。
链接一个报告页面上使用的多个事实表，这些事实表不能合并为一个大表。
自定义生成器。除了创建一个大表之外，在 Snowflake 中定义一个物化视图也很有趣，其中来自一个大表的数据在聚合级别上进行计算。如果您的仪表板包含详细信息页面，但也显示每月的信息，那么这可能是一个有用的选项。如果对于相关的报告页面来说足够的话， Snowflake 将自动使用来自物化视图的聚合信息。这可以进一步提高性能。
聚类键。这决定了数据存储的排序。通过将聚类键放在仪表板上的选择器上，Snowflake 将能够更快地提供所请求的数据选择。对聚类键中字段的顺序进行试验。
Snowflake 中的所有逻辑。理想情况下，您只需要对 Power BI 中的列执行类似 SUM 的计算。这可确保 Power BI 中仅请求报告所需的数据。为了给用户提供最佳性能，有时需要仔细考虑这一点，例如：
尽量避免平均值等等。
在 OBT 中为仍然在 Power BI 中应用固定过滤器的每个度量创建一个额外的列。
在 Power BI 中减去列时，请将该计算包含在“一个大表”中。

Power BI - 语义层
在 Power BI 中，也有多种方法来实现解决方案，您在此处做出的选择将影响仪表板的性能。

限制连接。
当有许多连接时，查询时间会迅速增加。因此，请尽量避免连接，例如每页使用一个大表。
双重尺寸。
如果您使用（选择器）维度，请使用“双重”存储类型。 Dual 将适当的维度值预先导入 Power BI，并产生比 Direct Query 更好的结果，即使整个查询是在 Snowflake 中执行的。例外的是包含个人数据（例如员工）的维度，根据 GDPR，这些数据只能由授权用户读取。对于导入的数据，不再可能根据用户角色来屏蔽数据。