从一种格式到另一种格式的平面文件转换 - 映射器工具/实现

发布于 2024-11-05 11:55:48 字数 961 浏览 0 评论 0原文

这是一个很广泛的话题,我在 stackoverflow 和一般谷歌上做了很多研究,但没有得到很好的答案。可能是因为我们的项目需求有点独特(肯定没有太大不同)。

我们有一个 Web 产品,它接受完整的 csv 文件作为一些业务数据的导入。它作为数据的多个部分。

上面的示例

ParentRow
.........Single row with 10-15 columns
EndParentRow
ChildRows
.........Multiple child rows with 10-15 columns
EndChildRows
............
............

根据家长数量会重复多次

我们有 2 个主要问题:

  1. 我们有 25-30 名客户使用上述产品,需要每月上传上述 CSV 文件。他们抱怨我们的文件格式令人难以承受(我完全同意,它是由前建筑师设计的)。

  2. 所有 25-30 个客户都从另一个系统以自己的格式获取数据(所有系统都有不同的格式)。差异范围包括不同的列名称、与相同文件格式的多表相比的二维数据、不同的数据值(映射/对应于我们系统中的某些值)。

由于时间和金钱的限制,我们无法实现满足所有人需求的地图解决方案。

我们必须想出创造性的解决方案来解决这个问题。我们现在想要探索的一个方向是使用一些开箱即用的通用映射工具将给定的 CSV 格式转换为我们的 CSV 格式。想法是客户将购买这种开箱即用的产品,并通过映射文件为他们提供一次性帮助,然后他们应该能够使用它运行,除非某些映射需要更改。

考虑到这一点,我的研究到目前为止还没有取得好的结果。我遇到的唯一有前途的工具是 Altova Mapforce。考虑到我们的客户不是高级技术用户,这有时确实显得有些过分,而且似乎有点复杂。

对此的任何帮助、想法或建议都将受到高度赞赏。我知道我还没有完全解释问题陈述,因此我将非常乐意回答问题以更好地定义需求。

This is kinda broad topic and I did lot of research on stackoverflow and general google but didn't get good answer. May be cause our project need is bit unique(surely not a lot different).

We have a Web product which takes in completely csv file as an import of some business data. It as multiple sections of data.

Example

ParentRow
.........Single row with 10-15 columns
EndParentRow
ChildRows
.........Multiple child rows with 10-15 columns
EndChildRows
............
............

above continue multiple times depending on number of parents

We have 2 main problems:

  1. We have 25-30 customers who uses above product and needs to upload above CSV file monthly. They complains about our file format that it is overwhelming(and I totally agree, it was designed by ex-Architect).

  2. All 25-30 customers gets data in their own format from another system(all of them have different formats). Difference range from different column names, 2 dimensional data compared to our multipe table in same file format, different data values(which maps/corresponds to certain values in our system).

With time and money as big constraint, we cannot implement a mapping solution which caters to everyone's need.

We have to come up with creative solution to solve this problem. One direction we want to explore for now is using some out of the box generic mapping tool to convert a given CSV format to our CSV format. Idea is customer will buy this out of box product and will do one time favor to them by mapping files and then they should be able to run with it unless some mapping needs to change.

With that in mind, my research didn't yield good results so far. Only promising tool I have come across is Altova Mapforce. It does seems overkill at time and seems bit complicated considering our customer who are not advanced technical users.

Any help, ideas or suggestions on this are highly appreciated. I know I haven't explained the problem statement completely, hence I will be more than happy to answers question to define requirement better.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

南街九尾狐 2024-11-12 11:55:48

查看 Pentaho PDI 工具。它是开源的,并且能够轻松地做到这一点。如果您确实愿意,您可以删除所有必要的插件并缩小规模,甚至将其嵌入到您的 Java 应用程序中。

Look at the Pentaho PDI tool. It's open source and it will be able to do this easily. If you really want to, you could remove all necessary plugin and scale this down, or even embed this into your Java application.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文