Data Science mit Python

Datenanalyse, Visualisierung und erste Machine Learning Algorithmen

Effiziente Datenanalyse mit Python

 

Python ist eine Programmiersprache, die auch im Bereich Data Science etabliert ist. Aufgrund ihrer klaren Syntax und leicht verständlichen Struktur eignet sie sich insbesondere für Einsteiger in Data Science, die bereits mit den Grundlagen des Programmierens vertraut sind. Bei richtiger Anwendung macht Python das Analysieren großer Datenmengen einfach, effizient und kann Unternehmen rasch neue Erkenntnisse aus dem eigenen Datenbestand verschaffen. Darüber hinaus ist Python plattformunabhängig – es läuft unter Linux, Mac und Windows ebenso wie unter Unix und vielen Unix-Systemen. 

 

Programm-Download

 

Datum

Ort

Preis *

Verfügbar

 

 

Ziele des Seminars
  • Sie erhalten eine umfassende Einführung in die wichtigsten Grundlagen der Programmiersprache Python: anhand eines durchgehenden Fallbeispiels erlernen Sie, wie Daten eingelesen, verarbeitet, aufbereitet und schließlich visualisiert werden.
  • Das Seminar führt in die bekannte Bibliothek pandas ein, welche bei Data Scientists für die Datenanalyse sehr beliebt ist.
  • Sie erhalten erste Einblicke in drei Machine Learning Algorithmen (Lineare Regression, Entscheidungsbaum, K-Means Clustering), welche in Python umgesetzt werden, um Ergebnisse aus Data Science-Analysen auswerten zu können.
  • Sie sind anschließend in der Lage, Grundlagen von Python selbstständig für unternehmenseigene Zwecke zu nutzen, können Ihre eigenen ersten Datenanalysen durchführen und wissen, wie Sie weitergehende Algorithmen und Methoden in Python finden.

 

Inhalte des Seminars

Das dreitägige Seminar schafft einen kompakten und umfangreichen Einstieg in die Data Science- und Programmiersprache Python. Die Teilnehmenden sind anschließend in der Lage, Python selbstständig für Datenanalysen im Unternehmen zu nutzen. Das Seminar umfasst hierbei eine Einführung in die Datenstruktur DataFrame vom Paket pandas (effizient Daten anpassen und verändern), Daten aus flat files (csv) einlesen bzw. schreiben, Visualisierung mit matplotlib und seaborn, erste eigene Funktionen schreiben und enthält einen Einstieg in Machine Learning mit den Algorithmen Entscheidungsbaum,  K-Nearest Neigbhor, einem einfachen Neuronalen Netz und den Cluster Verfahren  K-Means und DBSCAN. 

Konkrete Inhalte sind:

  • Grundlagen von Python
  • Einführung in das Data Science Paket pandas und dem DataFrame
  • Daten aus flat files (csv, txt, excel) einlesen und schreiben
  • Daten anpassen, konvertieren, modellieren
  • Visualisierung von Daten mit seaborn
  • Erste Supervised Algorithmen aus dem Machine Learning
  • Clustering Algorithmen (K-Means, DBSCAN)

Dieses Seminar ist sehr praxisorientiert. Die Teilnehmer arbeiten direkt und selbstständig mit der Programmiersprache Python in der Entwicklungsumgebung Spyder, so dass das Erlernte direkt geübt und vertieft werden kann. Der Trainer moderiert dabei verschiedene Aufgaben und begleitet die Teilnehmer durch die einzelnen Lehreinheiten.

Die Bitkom Akademie bietet ein zweitägiges Vertiefungsseminar zu Machine Learning an. Weitere Informationen zu Supervised & Unsupervised Machine Learning finden Sie hier.

 

Zielgruppen

Das Seminar richtet sich an angehende Data Scientists, BI-Analysts und Datenanalysten und an der Programmierung in Python interessierte Fachkräfte bzw. Projektleiter, welche schon erste Programmiererfahrung in Python haben und die Grundlagen der Programmiersprache Python für Data Science-Projekte erlernen möchten, um damit eigenständig an data mining Projekten mitzuwirken oder Python Code besser verstehen zu können.  

Die Teilnehmenden benötigen keine Erfahrung mit Python, sollten aber bereits Erfahrung mit einer Programmiersprache (z.B. VBA, Java, C, R, etc.) gemacht haben, um das Grundkonzept einer Programmiersprache zu verstehen (Variable in einer Programmiersprache, Zuweisung von Werten zu einer Variablen, Aufrufen von Funktionen, Parameter einer Funktion).

Sehr hilfreich sind grundlegende Vorkenntnisse im Bereich der Statistik (Begriffsdefinitionen wie bspw. Mittelwert, Median, Standardabweichung, Quantil, Dichtefunktion, Normalverteilung), Kenntnisse grundlegender mathematischer Symbole und Begriff (Summenzeichen, Integral, Funktion, Ableitung, Menge der natürlichen und reellen Zahlen, Vektor, Matrix) und Kenntnis der booleschen Algebra mit den logischen Operatoren (UND, ODER, NICHT). 
 

 

Ihr Seminarprogramm

Seminarprogramm | Tag 1

  • Begrüßung durch den Seminarleiter
    • Vorstellungsrunde & Erwartungshaltung der Teilnehmer
  • Hintergrund von Python
    • Anwendungsmöglichkeiten von Python
    • Installieren von Paketen
    • Die Entwicklungsumgebung Jupyter Lab
    • Aspekte von Python, welche von anderen Programmiersprachen abweichen
  • Einführung in das Data Science Paket pandas 
    • Elemente eines pandas data.frame
    • Eine Zeile oder Spalte auswählen, hinzufügen und verändern
    • Boolean indexing
    • Ein leeres data.frame erstellen
  • Mittagspause
  • Grundlegende Statistiken mit pandas 
    • Statistiken mit einem data.frame berechnen (Anzahl an Beobachtungen, Summe, Mittelwert, Median, Minimum, Maximum, Varianz,…)
    • Methoden im data.frame, um einen Überblick der Daten zu erhalten
    • Kreuztabelle (Kontingenztafel)
    • Auswertungen nach einer Variable gruppieren
    • Fehlende Werte löschen oder ergänzen
  • Daten einlesen 
    • Arbeitsverzeichnis setzen
    • Eine CSV Datei einlesen / schreiben
    • Überblick über nützliche Parameter beim Lesen und Schreiben
    • Große Dateien mit dem Paket pandas einlesen
    • Das pickle modul zum Speichern von Python Objekten
  • Ende des ersten Seminartages

 

 

Seminarprogramm | Tag 2

  • Begrüßung durch den Seminarleiter und Rückblick auf Tag 1
  • Control Flows
    • Die range() Funktion
    • Eine eigene Funktion schreiben und default Parameter setzen
    • For Schleifen, If-Else Bedingungen
    • List comprehension
    • Logische Vergleichsoperatoren
  • Visualisierung mit matplotlib und pandas
    • Die Hauptelemente beim Plotten
    • Einen Plot anpassen (x- und y-Achse ändern, Beschriftungen, Legende und Titel) und speichern
    • Auswahl von Farben
    • Subplots in einer Grafik erstellen
    • Erstellen von Scatterplot, Linienplot, Barplot, (gruppiertes) Histogram, Boxplot
  • Mittagspause
  • String Manipulation mit pandas; Einführung numpy
    • Information aus Text in einem DataFrame extrahieren
    • Text verändern und anpassen
    • Grundlagen von numpy, das die Basis von pandas ist
  • Machine Learning 
    • Begriffserklärungen (Machine Learning, Deep Learning, Künstliche Intelligenz)
    • Einteilung von Machine Learning Algorithmen  (Supervised vs. Unsupervised Learning)
    • Train-Test Split der Daten
    • Schritte beim Trainieren eines Machine Learning Algorithmus
    • Overfitting
    • One-Hot Encoding
  • Ende des zweiten Seminartages

 

 

Seminarprogramm | Tag 3

  • Begrüßung durch den Seminarleiter und Rückblick auf Tag 2
  • Entscheidungsbaum
    • Einführung in den Algorithmus
    • Einen Entscheidungsbaum in Python umsetzen
    • Erste Ergebnisse validieren
  • K-Nearest Neighbor und Neuronale Netze 
    • K-Nearest Neighbor in Python trainieren
    • Ein einfaches Neuronales Netz in scikit-learn umsetzen
    • Ergebnisse validieren
  • Mittagspause
  • K-Means Clustering
    • Einführung in den Algorithmus
    • Den K-Means Algorithmus in Python umsetzen
    • Güte von Cluster Ergebnissen einschätzen
  • DBSCAN
    • Einführung in den Cluster Algorithmus
    • DBSCAN mit scikit-learn in Python umsetzen
    • Ergebnisse validieren
  • Ende des Seminars

 

Zusätzliche Informationen
  • Die Teilnehmenden sollten vorab prüfen, ob firmeneigene Laptops Zugangsbeschränkungen beim Herunterladen von Dateien und Programmen haben, die der Referent bereitstellt. Die digitalen Unterlagen (Skript, Code, Dateien) werden über eine Cloud zur Verfügung gestellt. Die Einwahl in fremde WLAN-Netze sollte daher möglich sein.
  • Bitte stellen Sie sicher, dass Sie mit dem Betriebssystem (Windows, Mac OS, Linux), mit dem Sie arbeiten, vertraut sind.
  • Das Seminar findet im kleinen Kreis mit einer Maximalteilnehmerzahl von 15 Personen statt. Die Mindestteilnehmerzahl beträgt 5.
  • Dieser Online-Lehrgang wird mit Zoom durchgeführt. Systemvoraussetzungen und unterstützte Betriebssysteme können Sie hier einsehen. Für die Einwahl in Zoom über die verschiedenen Anwendungen (Desktop Client, App oder Web-Client) finden Sie hier einen zusätzlichen Vergleich zu den jeweiligen Eigenschaften. 
  • Die Bitkom Akademie ist anerkannter Bildungsträger in Baden-Württemberg und Nordrhein-Westfalen. Teilnehmer haben im Rahmen des Bildungszeitgesetzes die Möglichkeit, Bildungsurlaub bzw. eine Bildungsfreistellung zu beantragen. Auf Anfrage erstellen wir auch Anträge auf Anerkennung unserer Veranstaltungen in anderen Bundesländern.  
  • Anmeldeschluss ist 2 Wochen vor Seminarbeginn.
  • Wir erklären ausdrücklich, dass beim Bitkom – Unterzeichner der Charta der Vielfalt – jede Person, unabhängig von Geschlecht, Nationalität, ethnischer Herkunft, Religion oder Weltanschauung, Behinderung, Alter, sexueller Orientierung und Identität willkommen ist.

 

Seminar-Rücktrittsversicherung
  • Gemeinsam mit der HanseMerkur bietet die Bitkom Akademie eine freiwillige Seminar-Rücktrittsversicherung an.
  • Diese Versicherung ermöglicht Ihnen die kostenfreie Stornierung Ihrer Teilnahme, wenn kurzfristige oder unvorhergesehene Ereignisse Ihre Teilnahme am Seminar verhindern.
  • Die Kosten der Seminar-Rücktrittsversicherung sind abhängig vom Seminarpreis. Die Preisliste der HanseMerkur finden Sie hier.

 

Mehr erfahren Zur Buchung

 

 

Das sagen unsere Kunden

 

 

Haben Sie Fragen? Wir sind für Sie da!

 

Nicole Stoitschew
Nicole Stoitschew
Key Account Manager
Name
Anrede


 

 

Diese Seminare könnten Sie auch interessieren

 

Seminar Format Datum Absteigend sortieren Ort Verfügbar Preis

KI & Daten

Einführung in die Künstliche Intelligenz

Live-Online

17.01.25 Online
 

kostenfrei

KI & Daten

KI-Strategie für Unternehmen

Live-Online

21.01.25 Online
 

kostenfrei

KI & Daten

KI und Big Data: eine Einführung in rechtliche Fragestellungen

Live-Online

29.01.25 Online
 

kostenfrei

KI & Daten

ChatGPT – Technik, Business Cases & Ideation

Workshop

31.01.25 Online
 

650 €

KI & Daten

Der nachhaltige und zukunftssichere Einsatz von KI in der EU

Live-Online

31.01.25 Online
 

kostenfrei

KI & Daten

Rechtliche Vorgaben bei KI- & Big-Data-Projekten

Workshop

04.02.25 Online
 

650 €

KI & Daten

Crashkurs Prompt Engineering

Workshop

05.02.25 Online
 

400 €

KI & Daten

KI im HR-Alltag: Mit den richtigen Prompts zu mehr Effizienz und Innovation

Live-Online

06.02.25 Online
 

kostenfrei

KI & Daten

KI im Mittelstand – Erfolgsstrategien für kleine und mittlere Unternehmen

Live-Online

07.02.25 Online
 

kostenfrei

KI & Daten

Ausbildung zum KI Manager

Zertifikatslehrgang

11.02.25 Online
 

6.200 €

KI & Daten

KI: Frischzellenkur für Workflows

Live-Online

11.02.25 Online
 

kostenfrei

KI & Daten

KI und Ethik: Einblicke, Herausforderungen und Lösungsansätze

Live-Online

14.02.25 Online
 

kostenfrei

KI & Daten

Ausbildung zum Data Scientist

Zertifikatslehrgang

17.02.25 Online
 

6.200 €

KI & Daten

Künstliche Intelligenz 360°: Einstieg in die KI-Welt

Workshop

20.02.25 Online
 

1.300 €

KI & Daten

KI Knigge - Aufräumen bevor die Gäste kommen

Live-Online

21.02.25 Online
 

kostenfrei

KI & Daten

Ausbildung zum Chief Data Officer

Workshop

24.02.25 Online
 

6.200 €

KI & Daten

Ausbildung zum Web 3.0 & Metaverse Expert

Zertifikatslehrgang

27.02.25 Online
 

6.200 €

KI & Daten

Crashkurs Prompting mit Microsoft Copilot Chat

Workshop

07.03.25 Online
 

400 €

KI & Daten

Ausbildung zum Deep Learning Specialist

Zertifikatslehrgang

11.03.25 Online
 

6.200 €

KI & Daten

KI-Kompass für Führungskräfte: Strategie & Anwendungsmöglichkeiten

Workshop

11.03.25 Online
 

1.900 €

1

2

3