Library (perpustakaan) adalah
tempat untuk menyimpan kumpulan buku. Di dunia pemrograman, library juga
merupakan tempat penyimpanan, tapi bukan untuk buku, melainkan kumpulan kode
yang sebelumnya sudah dikompilasi. Kumpulan kode ini nantinya bisa digunakan
dalam sebuah program. Selain kode yang telah dikompilasi sebelumnya, library
mungkin juga berisi dokumentasi, data konfigurasi, templat pesan, kelas, nilai,
dan sebagainya. Dalam bidang data science, ada salah satu library yang cukup
populer, yakni library python.
APA ITU LIBRARY PYTHON?
Library python adalah
kumpulan modul terkait berisi kumpulan kode yang dapat digunakan berulang kali
dalam program yang berbeda. Adanya library membuat
pemrograman python menjadi lebih sederhana dan nyaman
bagi programmer karena tidak perlu menulis kode yang sama
berulang kali untuk program yang berbeda.
Library python
memainkan peran yang sangat vital dalam bidang pembelajaran mesin, data
science, visualisasi data, aplikasi manipulasi gambar dan data, dan
masih banyak lagi. Saat ini, ada lebih dari 137.000 library python
yang mengeliminasi kebutuhan untuk menulis kode dari awal.
KENAPA PYTHON POPULER?
Python populer karena
bahasa pemrograman ini lebih produktif jika dibandingkan dengan bahasa
pemrograman lain seperti C++ dan Java. Penggunaan python juga
didukung oleh kesederhanaan sintaks pemrograman, keterbacaan kode, dan perintah
seperti bahasa Inggris yang membuat pengkodean dengan python jauh
lebih mudah dan efisien
MACAM-MACAM LIBRARY PYTHON
Ada beberapa jenis library yang
populer di kalangan data scientist, di antaranya:
1.
TENSORFLOW
TensorFlow adalah platform end-to-end open-source untuk membuat aplikasi machine learning atau komputasi numerik cepat yang dibuat dan dirilis oleh Google. Library dasar ini dapat dipakai untuk membuat model deep learning secara langsung atau menggunakan library wrapper untuk menyederhanakan proses yang dibangun di atas TensorFlow.
Fitur utama TensorFlow meliputi bekerja secara efisien dengan ekspresi matematika yang melibatkan array multidimensi, dukungan yang baik dari jaringan saraf yang dalam dan konsep machine learning, hingga komputasi GPU/CPU di mana kode yang sama dapat dieksekusi pada kedua arsitektur.
2.
NUMPY
NumPy (Numerical Python) adalah library python yang digunakan untuk bekerja dengan array dan juga memiliki fungsi yang bekerja dalam domain aljabar linier, transformasi fourier, dan matriks. Library yang dibuat pada 2005 oleh Travis Oliphant ini merupakan proyek open source sehingga Anda dapat menggunakannya secara bebas. Meski python memiliki daftar yang melayani tujuan array, prosesnya begitu lambat sehingga memerlukan NumPy yang bisa menyediakan objek array hingga 50 kali lebih cepat daripada daftar python tradisional.
3. SCIPY
SciPy
(Scientific Python) adalah perpustakaan open-source yang
digunakan untuk perhitungan ilmiah tingkat tinggi. Jenis library ini
dibangun di atas ekstensi NumPy dan bekerja bersama untuk menangani komputasi
yang kompleks. NumPy memungkinkan pengurutan dan pengindeksan data array,
sementara kode data numerik disimpan di SciPy. Library python
ini juga banyak digunakan oleh para developer dan engineer.
4.
PANDAS
Pandas adalah
perpustakaan penting bagi para data scientist. Library untuk machine
learning yang bersifat open source ini menyediakan struktur
data tingkat tinggi yang fleksibel serta berbagai alat analisis. Penggunaannya
memudahkan analisis data, manipulasi data, dan pembersihan data. Pandas
mendukung berbagai jenis operasi seperti penyortiran, pengindeksan ulang,
iterasi, penggabungan, konversi data, visualisasi, agregasi, dan lain
sebagainya
5.
SCRAPY
Scrapy juga
termasuk perpustakaan open source yang digunakan untuk
mengekstraksi data dari website. Library ini
menyediakan perayapan web yang sangat cepat, pengikisan layar
tingkat tinggi, serta juga bisa digunakan untuk data mining dan
pengujian data otomatis.
6.
SCIKIT-LEARN
Scikit-learn
adalah library python terkenal yang digunakan untuk data
kompleks. Perpustakaan open source ini mendukung machine
learning dengan mendukung berbagai algoritma yang diawasi dan tidak
diawasi seperti regresi linier, klasifikasi, pengelompokan, dan lain
sebagainya. Library ini bekerja sama dengan Numpy dan SciPy.
7.
PYTORCH
PyTorch adalah
perpustakaan machine learning terbesar yang mengoptimalkan
komputasi tensor. Ia memiliki API yang kaya untuk melakukan komputasi tensor
dengan akselerasi GPU kuat, membuatnya mampu membantu memecahkan masalah
aplikasi yang terkait dengan jaringan saraf.
Perpustakaan tensor yang dioptimalkan ini utamanya digunakan untuk aplikasi deep learning menggunakan GPU dan CPU. Library phyton yang sebagian besar dikembangkan oleh tim Riset AI Facebook ini merupakan salah satu yang paling banyak digunakan di samping TensorFlow dan
8.
MATPLOTLIB
Jenis library ini bertanggung jawab untuk merencanakan data numerik. Itulah alasan Matplotlib digunakan dalam analisis data. Library python yang bersifat open source ini dapat memplot angka-angka berdefinisi tinggi seperti diagram lingkaran, histogram, scatterplot, grafik, dan lain-lain.
9.
KERAS
Keras adalah API deep learning yang ditulis dengan python dan berjalan di atas platform machine learning TensorFlow. Dengan lebih dari satu juta pengguna individu pada akhir tahun 2021, penggunaan Keras saat ini terbilang masif, baik di industri maupun komunitas penelitian. Bersama dengan TensorFlow, Keras lebih banyak dipakai daripada solusi deep learning lainnya dan sangat populer di kalangan startup yang menempatkan deep learning sebagai inti dari produk yang ditawarkan.
Tanpa disadari, Anda pun terus berinteraksi dengan
fitur yang dibuat dengan Keras (fitur yang salah satunya digunakan di Netflix).
Keras & TensorFlow juga merupakan favorit di antara para peneliti, bahkan
diadopsi oleh para peneliti di organisasi ilmiah besar, seperti CERN dan NASA.