如何在Palantir中对层次数据进行排序?
可以说我有飞行数据(来自铸造学院)。
数据集:
日期 | Flaigh_id | Origin_State | Carrier_name |
---|---|---|---|
Jan | 000000001 | 加利福尼亚 | 三角洲 |
航空公司 | 000000002 | Alabama | Delta Air |
00000000003 | 加利福尼亚 | 州 | 2 |
000000004 | 加利福尼亚 | 州 | 西南部 |
... | Jan | 启动 | 月 |
西南 我的汇总数据的标题看起来像:
原始状态 | 运营商名称 | 1月 | 2月 | ... |
---|---|---|---|---|
阿拉巴马州 | 三角洲航空 | 1 | 0 | ... |
加利福尼亚 | 三角洲航空 | 1 | 0 | ... |
加利福尼亚 | 西南 | 1 1 | 1 | ... |
我需要为每个州获得小计; 我需要对大多数航班进行排序; 我希望它通过国家对其进行排序,然后由运营商对其进行排序。
所需的输出
起源州 | 载体名称 | 月 | 2月 | ... |
---|---|---|---|---|
加利福尼亚 | NULL | 2 | 1 | ... |
加利福尼亚 | 三角洲 | 1 | 0 | ... |
加利福尼亚 | 西南 | 1 | 1 | ... |
阿拉巴马州 | null | 1 | 0 | ... |
阿拉巴马州 | 三角洲航空 | 1 | 0 | ... |
1 不能为类别提供尺寸;
表达式 - 不提供将日期列分为列的可能性。
Lets say I have flight data (from Foundry Academy).
Starting dataset:
Date | flight_id | origin_state | carrier_name |
---|---|---|---|
jan | 000000001 | California | delta air |
jan | 000000002 | Alabama | delta air |
jan | 000000003 | California | southwest |
feb | 000000004 | California | southwest |
... | ... | ... | ... |
I'm doing monthly data aggregation by state and by carrier. Header of my aggregated data looks like this:
origin state | carrier name | jan | feb | ... |
---|---|---|---|---|
Alabama | delta air | 1 | 0 | ... |
California | delta air | 1 | 0 | ... |
California | southwest | 1 | 1 | ... |
I need to get subtotals for each state;
I need to sort by most flights;
and I want it to be sorted by states, then by carrier.
desired output
origin state | carrier name | jan | feb | ... |
---|---|---|---|---|
California | null | 2 | 1 | ... |
California | delta air | 1 | 0 | ... |
California | southwest | 1 | 1 | ... |
Alabama | null | 1 | 0 | ... |
Alabama | delta air | 1 | 0 | ... |
PIVOT - doesn't provide subtotals for categories;
EXPRESSION - doesn't offer possibility to split date column into columns.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
我用轮廓解决了。不是最漂亮的解决方案,但它起作用。
我已经创建了到同一数据集的两个路径:
使用第一路径来计算完整的聚合。枢轴表和切换到枢轴数据:
第二个路径用于获取次写:
之后,我在第二个数据集中添加了空列“ carrier_name”。并在此之后建立了两个数据集的结合
,之后我添加了其他列
,然后对结果进行了排序。
我收到结果。但是它有其他列,现在我希望更改小计的行格式。
欢迎其他方法。由于我的真实数据具有更大的层次结构级别。
I solved it on Contour. not the prettiest solution, but it works.
I've created two paths to the same dataset:
1st path was used to calculate full aggregation. pivot table and switch to pivoted data:
2nd path was used to get subtotals:
Afterwards I've added empty column "carrier_name" to second dataset. And made union of both datasets
After that I've added additional column with expression
After that I sorted resulting dataset.
I received result. but it has additional column, and now I wish to change row formatting of subtotals.
Other approaches are welcome. as my real data has more hierarchical levels.