博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
几种 ETL 工具的比较(Kettle,Talend,Informatica 等)
阅读量:2036 次
发布时间:2019-04-28

本文共 1160 字,大约阅读时间需要 3 分钟。

成本:

成本包括多方面,主要包括软件产品, 售前培训, 售后咨询, 支持等。
产品本身是免费的,成本主要是培训和咨询,所以成本会一直维持在一个较低水平。
商业产品本身价格很高,但是一般会提供几次免费的咨询或支持,所以采用商用软件最初成本很高,但是逐渐下降。
手工编码最初成本不高,主要是人力成本,但后期维护的工作量会越来越大。

 

 

风险:

项目都是有风险的尤其是大项目。
项目的风险主要包括:超出预算,项目延期,没有达到用户的满意和期望
开源产品由于价格上的优势,可以在很大程度上降低项目的风险。

 

易用性:

Talend:有 GUI 图形界面但是以 Eclipse 的插件方式提供。
Kettle:有非常容易使用的 GUI,出现问题可以到社区咨询。
Informatica:有非常容易使用的 GUI,但是要专门的训练。
Inaplex Inaport:没有GUI

 

技术支持:

Talend:主要在美国
Kettle:在美国,欧洲(比利时,德国,法国,英国),亚洲(,日本,韩国)都可以找到相关技术支持人员。
Informatica:遍布全世界
Inaplex Inaport:主要在英国

 

部署:

Talend:创建  或perl 文件,并通过操作系统调度工具来运行
Kettle:可以使用 job 作业方式或操作系统调度,来执行一个转换文件或作业文件,也可以通过集群的方式在多台机器上部署。
Informatica:需要有 
Inaplex Inaport:需要 .net 2.0

 

速度:

Talend:需要手工调整,对特定数据源有优化知识。
Kettle:比 Talend 快,不过也需要手工调整,对 Oracle 和 PostGre 等数据源做了优化,同时也取决于转换任务的设计。
Informatica:是最快的
Inaplex Inaport:没有使用什么优化技术。

 

数据质量:

Talend:在 GUI 里有数据质量特性,可以手工写  语句。
Kettle:在 GUI 里有数据质量特性,可以手工写 SQL 语句、java脚本、正则表达式来完成数据清洗。
Informatica:专门有一个产品 Informatica Data Quality 来保证数据质量
Inaplex Inaport:因为只处理特定数据,所以比较容易进行数据清洗。

 

监控:

Talend:有监控和日志工具
Kettle:有监控和日志工具
Informatica:有非常详细的监控和日志工具
Inaplex Inaport:有监控和日志工具

 

 

连接性:

Talend:各种常用,文件, service。
Kettle:非常广泛的数据库,文件,另外可以通过插件扩展。
Informatica:各种数据源
Inaplex Inaport:ODBC 连接

转载地址:http://usqaf.baihongyu.com/

你可能感兴趣的文章
Rope --高效字符串处理数据结构
查看>>
Gap buffer -- 一个数据结构为可编辑的文本
查看>>
X/Open DTP模型,两阶段提交,JTA接口定义
查看>>
MySql binlog 日志
查看>>
spring 事务管理
查看>>
Redis集群
查看>>
线程中实现不可中断的任务
查看>>
世界城市时间计算
查看>>
Hessian原理分析
查看>>
WebCollector提供免费代理
查看>>
将WebCollector导入MAVEN项目
查看>>
WebCollector爬虫爬取一个或多个网站
查看>>
WebCollector爬虫的数据持久化
查看>>
插入排序
查看>>
谷歌面试题-100层楼两个棋子的问题
查看>>
系统架构师设计培训心得之二——架构设计
查看>>
Kafka技术知识总结之二——Kafka事务
查看>>
Kafka技术知识总结之五——Kafka的高可用性
查看>>
Redis技术知识总结之三——Redis数据淘汰机制
查看>>
Spring技术知识点总结之三——Spring Bean 的注入过程
查看>>