Pandák

Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2022. május 16-án felülvizsgált verziótól ; az ellenőrzéshez 1 szerkesztés szükséges .

pandák
Típusú Python könyvtár [d] és program a numerikus elemzéshez [d]
Szerző Wes McKinney [d] [1]
Fejlesztő Wes McKinney [d]
Beírva Python [2]
Operációs rendszer platformközi
Első kiadás 2008. január 11
legújabb verzió
Engedély BSD
Weboldal pandas.pydata.org
 Médiafájlok a Wikimedia Commons oldalon

A pandas  egy Python adatfeldolgozó és elemző könyvtár . A Pandas adatmanipuláció a NumPy könyvtárra épül , amely egy alacsonyabb szintű eszköz. Speciális adatstruktúrákat és műveleteket biztosít a numerikus táblák és idősorok kezeléséhez . A könyvtár neve a többdimenziós strukturált információhalmazok leírására használt ökonometriai "paneladatok" kifejezésből származik. A pandákat az új BSD licenc alatt terjesztik .

Hatókör

A fő alkalmazási terület az, hogy a Python-környezeten belül ne csak adatgyűjtéshez és tisztításhoz, hanem adatelemzési és modellezési feladatokhoz is munkát biztosítsunk anélkül, hogy specifikusabb nyelvekre kellene áttérni a statisztikai feldolgozáshoz (pl. R és oktáv ).

Folyamatban van a munka a "natív" kategorikus adattípusok megvalósításán is.

A csomag elsősorban az általános mutatók adatainak tisztítására és elsődleges értékelésére szolgál, mint például átlag, kvantilis stb.; ez nem egy statisztikai csomag a teljes értelemben, azonban a DataFrame és Series adatkészleteket bemenetként használják a legtöbb adatelemző és gépi tanulási modulban ( SciPy , Scikit-Learn és mások).

Jellemzők

A könyvtár főbb jellemzői:

A könyvtár nagy teljesítményre van optimalizálva, a kód legfontosabb részei Cython és C nyelven vannak megírva.

Történelem

A csomagfejlesztést 2008-ban az AQR Capital Management [ ] Wes McKinney indította el .  Mielőtt elhagyta az AQR-t, sikerült meggyőznie a vezetőséget, hogy engedélyezzék a könyvtár forráskódjának ingyenes licenc alatt történő kiadását.

Az AQR másik alkalmazottja, Chang She 2012-ben csatlakozott a projekthez, és a könyvtár második fő fejlesztője lett. Ugyanebben az időben a könyvtár népszerűvé vált a Python fejlesztők körében, és sok új közreműködő csatlakozott a projekthez. [5]

Használati példák

Görbék

pandák importálása pd - ként import matplotlib.pyplot plt - ként import numpy mint np df = pd . DataFrame ( np . random . randn ( 100 , 5 ), oszlopok = lista ( 'ABCDE' )) df = df . cumsum () # kumulatív összeget ad vissza egy DataFrame vagy Series tengelyen df . telek () plt . mutasd ()

Diagram

df = pd . DataFrame ( np . random . rand ( 10 , 5 ), oszlopok = lista ( 'ABCDE' )) df . cselekmény . bar ( halmozott = Igaz ) plt . mutasd ()

Menetrend

df = pd . DataFrame ( np . random . rand ( 7 , 5 ), oszlopok = lista ( 'ABCDE' )) df . cselekmény . doboz () plt . mutasd ()

oszlopdiagram

adatok = pd . Sorozat ( np . véletlenszerű . normál ( méret = 100 )) adatok . hiszt ( rács = hamis ) plt . mutasd ()

Jegyzetek

  1. https://wesmckinney.com/pages/about.html
  2. A py-pandas nyílt forráskódú projekt az Open Hubon: Nyelvek oldala - 2006.
  3. Kiadás 1.5.1 – 2022.
  4. Pandas Reset Index (2021. augusztus 30.). Letöltve: 2021. augusztus 30. Az eredetiből archiválva : 2021. augusztus 30.
  5. Daniel Chen. Pandák mindenkinek: Python adatelemzés . - Addison-Wesley Professional, 2017. - ISBN 978-0134546933 . Archiválva : 2021. szeptember 6. a Wayback Machine -nél

Irodalom

  • McKinney W. Python és adatelemzés = Python az adatelemzéshez. - DMK Press , 2015. - 482 p. - ISBN 978-5-97060-315-4 , 978-1-449-31979-3.
  • Brink H., Richards D., Feverolf M. Gépi tanulás. - Péter , 2018. - 336 p. - ISBN 978-5-496-02989-6 .
  • Vander Plas J. Python összetett feladatokhoz. Adattudomány és gépi tanulás = Python Data Science Handbook: Essential Tools for Working with Data. - Péter, 2017. - 576 p. — ISBN 978-5-496-03068-7 .
  • Heidt M. Tanuló pandák = Tanuló pandák. - DMK Press, 2018. - 432 p. - ISBN 978-5-97060-625-4 .