Tutorial Data Science Dengan Pyhton : Contoh Penggunaan Operasi Data Python di Library Numpy dan Panda
Python menangani data dalam berbagai format terutama melalui dua pustaka, Pandas dan Numpy. Kita telah melihat fitur-fitur penting dari kedua perpustakaan ini di bab-bab sebelumnya. Dalam bab ini kita akan melihat beberapa contoh dasar dari masing-masing perpustakaan tentang cara mengoperasikan data.
Operasi Data di Numpy
Objek paling penting yang didefinisikan dalam NumPy adalah tipe array berdimensi-N yang disebut ndarray. Ini menggambarkan koleksi item dari jenis yang sama. Item dalam koleksi dapat diakses menggunakan indeks berbasis nol. Sebuah instance dari kelas ndarray dapat dibangun oleh rutinitas pembuatan array yang berbeda yang dijelaskan nanti dalam tutorial. Ndarray dasar dibuat menggunakan fungsi array di NumPy sebagai berikut -
numpy.array
Berikut adalah beberapa contoh penanganan Numpy Data.
Contoh 1
# more than one dimensions import numpy as np a = np.array([[1, 2], [3, 4]]) print a
Outputnya adalah sebagai berikut -
[[1, 2] [3, 4]]
Contoh 2
# minimum dimensions import numpy as np a = np.array([1, 2, 3,4,5], ndmin = 2) print a
Outputnya adalah sebagai berikut -
[[1, 2, 3, 4, 5]]
Contoh 3
# dtype parameter import numpy as np a = np.array([1, 2, 3], dtype = complex) print a
Outputnya adalah sebagai berikut -
[ 1.+0.j, 2.+0.j, 3.+0.j]
Operasi Data di Pandas
Panda menangani data melalui Seri , Bingkai Data , dan Panel . Kami akan melihat beberapa contoh dari masing-masing ini.
Seri Panda
Seri adalah array berlabel satu dimensi yang mampu menyimpan data jenis apa pun (bilangan bulat, string, float, objek python, dll.). Label sumbu secara kolektif disebut indeks. Seri panda dapat dibuat menggunakan konstruktor berikut -
pandas.Series( data, index, dtype, copy)
Contoh
Di sini kami membuat seri dari Numpy Array.
#import the pandas library and aliasing as pd import pandas as pd import numpy as np data = np.array(['a','b','c','d']) s = pd.Series(data) print s
Its keluaran adalah sebagai berikut -
0 a 1 b 2 c 3 d dtype: object
Pandas DataFrame
Kerangka data adalah struktur data dua dimensi, yaitu data disejajarkan dalam bentuk tabel dalam baris dan kolom. DataFrame pandas dapat dibuat menggunakan konstruktor berikut -
pandas.DataFrame( data, index, columns, dtype, copy)
Mari kita sekarang membuat DataFrame yang diindeks menggunakan array.
import pandas as pd data = {'Name':['Tom', 'Jack', 'Steve', 'Ricky'],'Age':[28,34,29,42]} df = pd.DataFrame(data, index=['rank1','rank2','rank3','rank4']) print df
Its keluaran adalah sebagai berikut -
Age Name rank1 28 Tom rank2 34 Jack rank3 29 Steve rank4 42 Ricky
Panel Panda
Sebuah panel adalah kontainer 3D data. Istilah data Panel berasal dari ekonometrik dan sebagian bertanggung jawab atas nama pandas - pan (el) -da (ta) -s.
Panel dapat dibuat menggunakan konstruktor berikut -
pandas.Panel(data, items, major_axis, minor_axis, dtype, copy)
Dalam contoh di bawah ini kami membuat panel dari dict dari Objek DataFrame
#creating an empty panel import pandas as pd import numpy as np data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)), 'Item2' : pd.DataFrame(np.random.randn(4, 2))} p = pd.Panel(data) print p
Its keluaran adalah sebagai berikut -
<class 'pandas.core.panel.Panel'> Dimensions: 2 (items) x 4 (major_axis) x 5 (minor_axis) Items axis: 0 to 1 Major_axis axis: 0 to 3 Minor_axis axis: 0 to 4
Post a Comment for "Tutorial Data Science Dengan Pyhton : Contoh Penggunaan Operasi Data Python di Library Numpy dan Panda"