DATENWISSENSCHAFT MIT PYTHON: PANDAS DURCH BEISPIELE - Cesar Perez Lopez

DATENWISSENSCHAFT MIT PYTHON: PANDAS DURCH BEISPIELE

Cesar Perez Lopez
pubblicato da Cesar Perez

dai un voto

Prezzo online:

0,00 €

Leggi con Kobo Plus

Aggiungi ai preferiti

Leggi con Kobo Plus

Aggiungi ai preferiti

Pandas ist ein Python-Paket, das schnelle und flexible Datenstrukturen bereitstellt, die die Arbeit mit relationalen" oder beschrifteten" Daten einfach und intuitiv machen sollen. Sein Ziel ist es, der grundlegende, übergeordnete Baustein für die praktische Analyse realer Daten in Python zu sein. Darüber hinaus hat es das größere Ziel, das leistungsfähigste, flexibelste und in jeder Sprache verfügbare Open-Source-Tool zur Datenbearbeitung/-analyse zu werden. Die beiden Hauptdatenstrukturen in Pandas sind: Serien für eindimensionale Daten und DataFrames für zweidimensionale Daten. Beide Frameworks bewältigen die überwiegende Mehrheit der typischen Anwendungsfälle in den Bereichen Finanzen, Statistik, Sozialwissenschaften und vielen Bereichen des Ingenieurwesens. Für R-Benutzer bietet der DataFrame alles, was R data.frame bietet, und noch viel mehr. pandas basiert auf NumPy und ist so konzipiert, dass es sich gut in eine wissenschaftliche Computerumgebung mit vielen anderen Bibliotheken von Drittanbietern integrieren lässt. Pandas erleichtert die Arbeit in Data Science. Für Datenwissenschaftler ist die Arbeit mit Daten typischerweise in mehrere Phasen unterteilt: Sammeln und Bereinigen von Daten, Analysieren/Modellieren und anschließendes Organisieren der Analyseergebnisse in einer Form, die für die grafische Darstellung oder Anzeige in Tabellenform geeignet ist. Pandas ist ein Hilfstool für all diese Aufgaben. Pandas wird auch häufig bei der Produktion von Big-Data- und Finanzanwendungen eingesetzt.