如何在 Pentaho Spoon 中拆分列的值？

发布于 2025-01-01 13:07:57 字数 966 浏览 1 评论 0原文

我想创建一个 Spoon 转换，它将适用于列的多个值。我的转换的输入是一个 CSV 文件。在该 CSV 文件中，有一个名为“Technology”的列，其中包含 0 个或多个由分号分隔的值，如下所示。

+------------------------------------------------------+

 row_id |   Technology
+------------------------------------------------------+

1       | Cobol ; Db2 ; Jcl ; Vsam ; Cics ; Changeman ;

2       | Oracle ; Sql ; Db2 ; Oracle 9i ;

3       | Windows 2000 ; SQL ;
+------------------------------------------------------+

我在数据库中有一个名为“Technologies”的表，其架构如下：

+----------------------+

Technologies

+----------------------+
 id   | technology_name

+----------------------+

其中 id 列设置为自动增量。

仅当 Technologies 表中不存在该值时，我才想插入 technology 列的值。

谁能告诉我

1) 使用哪种类型的步骤来拆分 technology 列的值？ 2）如何只插入一次值？例如，在 row 1 和 row 2 中，Db2 重复，但我只想插入 Db2 一次。

提前致谢！

原文

I want to create a Spoon transformation which will work on multiple values of an column.
Input to my transformation is an CSV file. In that CSV file there's one column named 'Technology' which contains 0 or more values seperated by semi colon as follows.

+------------------------------------------------------+

 row_id |   Technology
+------------------------------------------------------+

1       | Cobol ; Db2 ; Jcl ; Vsam ; Cics ; Changeman ;

2       | Oracle ; Sql ; Db2 ; Oracle 9i ;

3       | Windows 2000 ; SQL ;
+------------------------------------------------------+

I have one table in database named 'Technologies' and its schema is as follows :

+----------------------+

Technologies

+----------------------+
 id   | technology_name

+----------------------+

where id column is set to auto increment.

I want to insert values of technology column only if that value is not present in Technologies table.

Can anyone please tell me

1) Which type of step to be used to split values of technology column?
2) How to insert value only once? For example in row 1 and row 2, Db2 is repeated but I want to insert Db2 only once.

Thanks in advance !

分享到QQ

分享到微博