pandák | |
---|---|
Típusú | Python könyvtár [d] és program a numerikus elemzéshez [d] |
Szerző | Wes McKinney [d] [1] |
Fejlesztő | Wes McKinney [d] |
Beírva | Python [2] |
Operációs rendszer | platformközi |
Első kiadás | 2008. január 11 |
legújabb verzió |
|
Engedély | BSD |
Weboldal | pandas.pydata.org _ |
Médiafájlok a Wikimedia Commons oldalon |
A pandas egy Python adatfeldolgozó és elemző könyvtár . A Pandas adatmanipuláció a NumPy könyvtárra épül , amely egy alacsonyabb szintű eszköz. Speciális adatstruktúrákat és műveleteket biztosít a numerikus táblák és idősorok kezeléséhez . A könyvtár neve a többdimenziós strukturált információhalmazok leírására használt ökonometriai "paneladatok" kifejezésből származik. A pandákat az új BSD licenc alatt terjesztik .
A fő alkalmazási terület az, hogy a Python-környezeten belül ne csak adatgyűjtéshez és tisztításhoz, hanem adatelemzési és modellezési feladatokhoz is munkát biztosítsunk anélkül, hogy specifikusabb nyelvekre kellene áttérni a statisztikai feldolgozáshoz (pl. R és oktáv ).
Folyamatban van a munka a "natív" kategorikus adattípusok megvalósításán is.
A csomag elsősorban az általános mutatók adatainak tisztítására és elsődleges értékelésére szolgál, mint például átlag, kvantilis stb.; ez nem egy statisztikai csomag a teljes értelemben, azonban a DataFrame és Series adatkészleteket bemenetként használják a legtöbb adatelemző és gépi tanulási modulban ( SciPy , Scikit-Learn és mások).
A könyvtár főbb jellemzői:
A könyvtár nagy teljesítményre van optimalizálva, a kód legfontosabb részei Cython és C nyelven vannak megírva.
A csomagfejlesztést 2008-ban az AQR Capital Management [ ] Wes McKinney indította el . Mielőtt elhagyta az AQR-t, sikerült meggyőznie a vezetőséget, hogy engedélyezzék a könyvtár forráskódjának ingyenes licenc alatt történő kiadását.
Az AQR másik alkalmazottja, Chang She 2012-ben csatlakozott a projekthez, és a könyvtár második fő fejlesztője lett. Ugyanebben az időben a könyvtár népszerűvé vált a Python fejlesztők körében, és sok új közreműködő csatlakozott a projekthez. [5]
Görbék
pandák importálása pd - ként import matplotlib.pyplot plt - ként import numpy mint np df = pd . DataFrame ( np . random . randn ( 100 , 5 ), oszlopok = lista ( 'ABCDE' )) df = df . cumsum () # kumulatív összeget ad vissza egy DataFrame vagy Series tengelyen df . telek () plt . mutasd ()Diagram
df = pd . DataFrame ( np . random . rand ( 10 , 5 ), oszlopok = lista ( 'ABCDE' )) df . cselekmény . bar ( halmozott = Igaz ) plt . mutasd ()Menetrend
df = pd . DataFrame ( np . random . rand ( 7 , 5 ), oszlopok = lista ( 'ABCDE' )) df . cselekmény . doboz () plt . mutasd ()oszlopdiagram
adatok = pd . Sorozat ( np . véletlenszerű . normál ( méret = 100 )) adatok . hiszt ( rács = hamis ) plt . mutasd ()Piton | |
---|---|
Közösség | |
Megvalósítások | |
Egyéb |
|