Pentaho 8.2 atau saat ini sering di sebut dengan nama Hitachi Vantara baru saja di release pada bulan November 2018
Pentaho 8.2 atau saat ini sering di sebut dengan nama Hitachi Vantara baru saja di release pada bulan November 2018.
Pastinya ada beberapa fitur baru dan beberapa perbaikan bug di versi 8.2 ini.
Apakah anda penasaran dengan fitur-fitur baru di pentaho 8.2 ini?
Pentaho Hitachi Vantara 8.2
Kita cari tahu yukk, apa saja fitur baru yang di tawarkan oleh pentaho 8.2 ini. Bagaimana cara instalasi nya? Dimana anda bisa mendownload nya? Serta hal lain yang perlu anda ketahui di pentaho 8.2 ini.
Contents
- Yang Baru di Pentaho 8.2
- Step Eksekutor Python yang Baru
- Akses ke HCP dari PDI
- Peningkatan Data Streaming
- Peningkatan Operasi Data
- Perubahan Minor Business Analytic dan Peningkatan Integrasi Data
- Rerefensi Komponen Pentaho 8.2
- Server
- Workstation
- Perangkat Lunak Tertanam / Embedded Software
- Server Aplikasi
- Repositori Solusi Database
- Sumber data
- Sumber Data Besar / Big Data
- Dialek SQL Khusus
- Keamanan
- Java Virtual Machine / Mesin Virtual Java
- Browser Web
- Tempat Download Pentaho 8.2
- Akses Data dan ETL (Ketel)
- Pelaporan
- Penemuan dan Analisis Data / On Line Analytical Processing (OLAP)
- Dasboard dan Visualisasi
- Platform Pentaho
- Kemampuan data besar / Big Data (community.pentaho.com/BigData)
- - Proyek Terkait -
1. Apa Saja yang Baru di Pentaho versi 8.2
Pentaho 8.2 Enterprise Edition menghadirkan beragam fitur dan peningkatan, mulai dari streaming baru dan kemampuan Spark di PDI hingga peningkatan dalam pemrosesa big data dan keamanan data cloud. Pentaho 8.2 juga terus meningkatkan pengalaman platform Pentaho dengan memperkenalkan fitur dan peningkatan baru.
Step Eksekutor Python yang Baru
Step Python Executor menggabungkan kemampuan scripting yang kuat dan algoritma bahasa scripting CPython ke dalam transformasi Anda. Step PDI yang baru ini sangat berguna bagi data scientist dan insinyur data yang ingin memanfaatkan pembelajaran mesin (machine learning) dan metode pembelajaran yang mendalam, strategi manajemen model, dan integrasi dengan notebook data science.
Dengan dukungan asli untuk Pandaf dataFrames dan array NumPy, step Python Executor dapat membaca data dari berbagai sumber, memodifikasi dan memperoleh nilai dari data, kemudian memberikan output sebagai seperangkat PDI field / kolom.
Langkah ini menampilkan dua metode untuk mengeksekusi skrip: menjalankan file skrip dari lokasi lokal atau yang dihosting, atau menyematkan skrip secara manual di dalam step.
Akses ke HCP dari PDI
Sekarang Anda dapat mengakses sistem penyimpanan terdistribusi Hitachi Content Platform (HCP) dari browser Virtual File System (VFS) PDI. Dalam HCP, daftar kontrol akses (ACL) memberikan hak pengguna untuk melakukan berbagai operasi file. Ruang nama digunakan untuk pengelompokan logis, akses, dan metadata objek (seperti pengaturan retensi dan fail). Pelajari lebih lanjut tentang cara mengatur akses ke HCP dari PDI.
Peningkatan Data Streaming
Pentaho Data Integration (PDI) menampilkan step-step baru yang disesuaikan dengan mesin Spark di Lapisan Eksekusi Adaptif (AEL) dan akses ke data streaming Advanced Message Queuing Protocol (AMQP).
Peningkatan Kemampuan Spark di PDI.
Step-step Spark sekarang dikustomisasi untuk menggunakan API Spark asli. API Spark dirancang untuk memanfaatkan mesin Spark canggih yang dirancang untuk pemrosesan dan distribusi sumber daya perangkat keras yang lebih cepat. Pelajari lebih lanjut tentang Spark pada AEL di PDI.
Peningkatan AMQP di PDI.
Protokol Antrian Pesan Lanjutan (AMQP) menyediakan konektivitas yang kuat untuk memproduksi atau mengkonsumsi data streaming langsung di Pentaho. Anda dapat menggunakan step-step transformasi AMQP Consumer dan AMQP Produser baru untuk membangun antrian transformasi dan pesan untuk pemrosesan data IoT saat peristiwa terjadi. Langkah-langkah ini menampilkan integrasi dengan, dan mengamankan konektivitas ke, sumber pesan AMQP, aliran data, atau monitor peringatan, baik di mesin lokal ataupun di cloud.
Streaming Berbasis Push untuk Dasboard.
Di Pentaho 8.2, Anda sekarang dapat membuat layanan data streaming Pentaho. Dengan CTools, Anda dapat menggunakan layanan data ini untuk mengembangkan dasboard untuk menampilkan data streaming Anda. Data streaming di push melalui layanan data ke dasboard Anda. Pelajari lebih lanjut tentang analitik streaming(streaming analytic), layanan data streaming, dan pengembangan dashboard streaming.
Peningkatan Operasi Data
PDI 8.2 mencakup lebih banyak penganalisa data khusus, antarmuka status eksekusi yang diperbarui, dan dukungan OpenJDK.
Analisis Data Lineage Baru.
PDI sekarang menyertakan langkah metaverse khusus dan analisis entri untuk pelacakan garis keturunan data:
Input File Hadoop
Output File Hadoop
Spark Kirim
Untuk melihat daftar lengkap langkah dan entri dengan penganalisa garis keturunan data bea cukai, lihat Jalur Data.
Jendela Pemantauan Status Eksekusi yang Lebih Baik.
Halaman Status PDI, yang digunakan untuk melihat transformasi dan rincian job yang dilakukan dari jarak jauh dan terjadwal, telah ditingkatkan untuk kemudahan penggunaan. Halaman ini sekarang memiliki grafik yang jelas menampilkan kontrol untuk menjalankan, melanjutkan, menjeda, dan menghentikan transformasi atau job.
Dukungan OpenJDK.
Pentaho sekarang mendukung Oracle JDK 8 dan OpenJDK 8. Dukungan ini meluas ke Lapisan Eksekusi Adaptif (AEL). Saat menggunakan AEL dengan Amazon EMR, Anda tidak perlu lagi menginstal Oracle JDK 8 untuk berjalan di OpenJDK 8. Lihat persyaratan perangkat lunak Pentaho untuk Java Runtime Environment (JRE) untuk mempelajari lebih lanjut.
Analisis Minor Business dan Peningkatan Integrasi Data
Dalam Analyzer, penambahan filter baru memberikan kemampuan untuk membandingkan kumpulan data. Dalam PDI, dukungan tambahan untuk injeksi metadata dan step JSON yang ditingkatkan berkontribusi pada stabilitas platform dan pengalaman kegunaan yang lebih baik secara keseluruhan.
Filter Perbandingan Analyzer pada Tingkat Numerik:
Anda sekarang dapat menggunakan filter perbandingan pada tingkat dimensi numerik untuk memfilter data untuk tampilan yang lebih fokus. Filter ini mencakup Lebih Besar Dari, Kurang Dari, Lebih Besar dari atau Sama dengan, Kurang Dari atau Sama dengan, dan Antara. Misalnya, Anda dapat menampilkan ukuran Penjualan dengan fokus hanya pada pelanggan berusia antara 20 dan 40. Lihat Membuat Filter Perbandingan pada Tingkat Numerik untuk informasi lebih lanjut.
Dukungan Injeksi Metadata yang Diperluas.
Anda sekarang dapat menyuntikkan metadata ke field apa pun di step Pentaho Data Integration (PDI) berikut:
Input
- Get System Data
Scripting
- Execute Row SQL Script
- Execute SQL Script
- User Defined Java Class
Streaming
- AMQP Consumer
- AMQP Producer
- JMS Consumer
- JMS Producer
Transform
- Add a Checksum
- Set Field Value
- Set Field Value to a Constant
Pelajari lebih lanjut tentang step-step PDI yang mendukung injeksi metadata.
Peningkatan JSON.
Step Input JSON sekarang menampilkan jendela Select Fields baru untuk menentukan field apa yang ingin Anda ekstrak dari file sumber Anda. Jendela menampilkan struktur file sumber JSON. Setiap field dalam struktur ditampilkan dengan kotak centang bagi Anda untuk menunjukkan apakah itu harus diekstraksi dari file atau tidak. Anda juga dapat mencari dalam struktur untuk field tertentu.
Langkah PDI Dihapus.
Langkah-langkah transformasi PDI dan entri pekerjaan untuk SAP, Paleo, dan OpenERP sudah usang dalam Pentaho 8.2. Anda sekarang dapat menemukan langkah-langkah dan entri ini di folder yang sudah tidak digunakan pada tab Desain di panel Jelajahi Klien PDI.
Business Intelligence adalah sekumpulan teknik dan alat untuk mentransformasi dari data mentah menjadi informasi yang berguna dan bermakna untuk tujuan analisis bisnis. Teknologi BI dapat menangani data yang tak terstruktur dalam jumlah yang sangat besar untuk membantu mengidentifikasi, mengembangkan, dan selain itu membuat kesempatan strategi bisnis yang baru. (Sumber : Definisi Bisnis Intelligence)
2. Referensi Komponen Pentaho 8.2
Pentaho bertujuan untuk mengakomodasi lingkungan komputasi yang beragam. Daftar ini memberikan detail tentang komponen lingkungan dan versi yang kami dukung. Jika Anda memiliki pertanyaan tentang lingkungan komputasi khusus Anda, silakan hubungi Dukungan Pentaho.
Server
Server Pentaho adalah perangkat keras independen dan berjalan pada komputer kelas server yang mematuhi spesifikasi ini untuk perangkat keras minimum dan sistem operasi yang diperlukan:
(Table Detail)
Workstation
Alat desain Pentaho ini tidak tergantung pada perangkat keras dan dijalankan pada komputer kelas klien yang mematuhi spesifikasi ini untuk perangkat keras minimum dan sistem operasi yang diperlukan.
- Pentaho Aggregation Designer
- Pentaho Data Integration
- Pentaho Metadata Editor
- Pentaho Report Designer
- Pentaho Schema Workbench
Perangkat Lunak Tertanam
Ketika menanamkan perangkat lunak Pentaho ke aplikasi lain, lingkungan komputasi harus mematuhi spesifikasi ini untuk perangkat keras minimum dan sistem operasi yang diperlukan.
- Embedded Pentaho Reporting
- Embedded Pentaho Analysis
- Embedded Pentaho Data Integration
Server Aplikasi
Server tempat Anda menggunakan perangkat lunak Pentaho harus menjalankan salah satu dari server aplikasi ini:
- JBoss EAP 7.x dengan Oracle Java 8.x
- Tomcat 8.0 & 8.5 (default) dengan Oracle Java 8.x
Repositori Solusi Database
Perangkat lunak Pentaho menyimpan artefak pemrosesan dalam repositori basis data ini:
- MySQL 5.6 & 5.7 (SQL 92)
- Oracle 11.2 & 12.1 (SQL 92)
- PostgreSQL 9.5 & 9.6 *
- MS SQL Server 2014, 2016
- * Basis data solusi terinstal default
Sumber data
Perangkat lunak Pentaho terhubung ke sumber data relasional dan non-relasional ini.
** Gunakan driver yang sesuai dengan JDBC 3.x atau 4.x yang kompatibel dengan standar SQL-92 saat berkomunikasi dengan sumber data relasional. Untuk kenyamanan Anda, kami menyediakan daftar driver yang digunakan untuk mendapatkan data dari database JDBC relasional.
Sumber Big Data
Perangkat lunak Pentaho bisa terhubung ke sumber big data ini.
- Shim berikut disertakan dalam plugin Pentaho Big Data untuk Pentaho Versi 8.2: Cloudera Distribution for Hadoop 5.14, Amazon EMR 5.11, Hortonworks 3.0, dan MapR 6.0. Shim yang didukung lainnya dapat diunduh dari Portal Dukungan Pelanggan Pentaho.
- EMR 5.9 shims tidak mendukung Impala. Karena masalah EMR Amazon yang ada, shim 5.9 EMR tidak mendukung jenis Penyimpanan Blok S3 sebagai output untuk pekerjaan PMR. Dukungan untuk S3A disediakan dengan ESDM 5.9.
- CDH 5.13 dan CDH 5.14 shims telah disertifikasi dengan Impala JDBC Connector 2.5.43 driver Cloudera Simba. Anda harus memiliki versi rilis Pentaho saat ini untuk menggunakan CDH 5.13 atau CDH 5.14 shim.
- Seperti halnya sumber data apa pun, kinerja Pentaho Analyzer pada Impala akan bergantung pada bentuk data, konfigurasi Impala, dan jenis permintaan. Lihat artikel praktik terbaik Portal Pelanggan tentang Pentaho Analyzer di Impala untuk informasi lebih lanjut.
- Hive2 sebagai sumber data untuk CDH juga mendukung Hive on Spark. Hive2 sebagai sumber data untuk HDP juga mendukung Hive on Tez.
- Simba Spark SQL driver perlu diunduh, diinstal, dan dikonfigurasikan untuk digunakan sebagai sumber data untuk Hortonworks. Lihat instruksi dari pentaho tentang mengunduh, menginstal, dan mengonfigurasi untuk informasi lebih lanjut.
- MapR client 6.0 tidak mendukung Hbase, dan hanya mendukung MapR-DB, yang memerlukan pengaturan tambahan. Lihat dokumentasi MapR Mapping ke Table Namespaces HBase untuk informasi lebih lanjut tentang pengaturan ini.
- Driver Simba yang diperlukan untuk Google BigQuery adalah versi yang kompatibel dengan JDBC 4.2. Lihat https://cloud.google.com/bigquery/partners/simba-drivers/.
Dialek Khusus SQL
Perangkat lunak Pentaho menghasilkan dialek SQL khusus ketika berkomunikasi dengan sumber data ini.
**** Jika sumber data Anda tidak ada dalam daftar ini dan kompatibel dengan SQL-92, perangkat lunak Pentaho menggunakan dialek SQL generik.
Keamanan
Perangkat lunak Pentaho terintegrasi dengan sistem otentikasi keamanan pihak ketiga ini:
- Active Directory
- CAS
- Otentikasi Microsoft Windows yang terintegrasi
- LDAP
- RDBMS
Java Virtual Machine
Persyaratan perangkat lunak Pentaho untuk Java Runtime Environment (JRE).
Browser Web
Pentaho mendukung versi utama browser Web yang tersedia untuk umum enam minggu sebelum finalisasi rilis Pentaho, kecuali sebagaimana disebutkan di bawah ini.
3. Tempat Download Pentaho 8.2
Pentaho secara erat memadukan integrasi data dengan analisis bisnis dalam platform modern yang mengintegrasikan pengguna TI dan bisnis untuk dengan mudah mengakses, memvisualisasikan, dan menjelajahi semua data yang mempengaruhi hasil bisnis.
Pentaho dapat digunakan sebagai rangkaian lengkap atau sebagai komponen individu yang dapat diakses di tempat, di cloud atau saat bepergian (mobile). Pentaho Kettle memungkinkan TI dan pengembang untuk mengakses dan mengintegrasikan data dari sumber apa pun, dan mengirimkannya ke aplikasi bisnis Anda, semuanya dari dalam alat grafis yang intuitif dan mudah untuk digunakan.
Akses Data dan ETL (Kettle)
Alat yang digunakan untuk mengakses data dan melakukan proses ETL (Ekstrak Transform Load) dinamakan Pentaho Data Integration.
Sebelum bisa menjalankan Pentaho Data Integration, yang perlu anda lakukan yaitu melakukan download tool Pentaho Data Integration di sini.
Pelaporan
Untuk membuat laporan atau report, tool yang anda perlukan pada pentaho 8.2 yaitu Pentaho Report Designer.
Sebelum anda dapat menjalankan tool Pentaho Report Designer, maka yang perlu anda lakukan adalah melakukan download tool Pentaho Report Designer di sini.
On Line Analytical Procssing (OLAP)
On Line Analytical Processing (OLAP) diperlukan untuk melakukan analisa terhadap informasi yang ditampilkan.
Tool yang kita gunakan untuk keperluan OLAP adalah Pentaho Schema Workbench. Anda bisa mendownload tool Pentaho Schema Workbench pada link berikut ini.
Dasbor dan Visualisasi
Untuk membuat dashboard atau visualisasi graphic di pentaho, anda bisa memanfaatkan tool CDE (Community Dashboard Editor) yang terintegrasi dengan Pentaho Business Analytic atau Pentaho BI Server.
Untuk bisa menggunakan nya, tentunya anda harus mendownload Pentaho BI Server telebih dahulu. Untuk mendownload Pentaho BI Server anda bisa mengakses ke kaitan berikut.
Platform Pentaho
Kemampuan Big Data (community.pentaho.com/BigData)
Untuk kemampuan Big Data, pentaho menggunakan Hadoop shims yang bisa anda dapatkan dengan cara mendownload nya di sini.
- Proyek Terkait -
Embedded Reporting (sourceforge.net/projects/jfreereport)
Untuk embedded report engine, pentaho menggunakan engine jfreereport yang sudah terpercaya sebagai engine penghasil report yang bersifat open source. Anda bisa mendownload nya pada link yang tertera di atas atau bisa melalui tautan berikut ini.
Embedded OLAP Engine (sourceforge.net/projects/mondrian)
Pentaho memanfaatkan engine OLAP yang dinamakan dengan Mondrian. Untuk mengetahui lebih banyak tentang Mondrian, anda bisa mendownload nya melalui project link di atas, atau anda bisa melakukannya via tautan berikut ini.
Penambangan Data (sourceforge.net/projects/weka)
Salah satu tool yang biasa digunakan bersama dengan pentaho adalah Weka. Weka berfungsi sebagai tool untuk melakukan aktivitas data mining maupun untuk melakukan predictive analytic dari data source yang ada.
Untuk bisa menggunakan nya, anda dapat mendownload tool tersebut melalui tautan berikut ini.
Bagaimana? Anda tertarik untuk menggunakan tool yang disediakan oleh pentaho ? nantikan artikel-artikel lainnya yang membahas materi-materi seputar pentaho tools, baik itu pentaho data integration, pentaho report designer, pentaho schema workbench, pentaho CDE, dan tool pentaho yang lainnya.
Reff :
#pentaho, #pentahotutorial, #pentahodownload
help.pentaho.com