Apache Spark

Neueste Artikel zum Thema

Data Science: Cloudera startet All-in-one-Datendienst in der Cloud

Die Cloudera Data Platform One bündelt alle für Datenanalyse und -erkundung erforderlichen Tools als Software-as-a-Service auf Basis der Lakehouse-Architektur.

Machine Learning: SynapseML automatisiert .NET-Anbindung an Apache Spark

Mit dem neuen API-Satz ermöglicht Microsofts ML-Bibliothek den Sprachen der .NET-Familie wie C# und F# verteiltes Machine Learning mit Apache Spark.

heise+ Aktionsangebot

1 Jahr heise+ zum Aktionspreis: Jetzt heise+ für nur 1,90 € pro Woche lesen und 1 Jahr lang geballtes, brandaktuelles IT- und Tech-Wissen sichern. Unbegrenzter Zugriff auf alle heise+ Beiträge inklusive der Inhalte aller Heise-Magazine. Nur bis zum 31. Mai!

Female,Eye,Close,Up,With,Smart,Contact,Lens,With,Digital

JetBrains' Big Data Tools 1.6 behalten Flink-Jobs im Auge

Die Big Data Tools 1.6, ein Plug-in für Zugriff auf Zeppelin Notebooks, beherrscht nun auch das Monitoring von Apache Flink und bindet den Hive Metastore ein.

Apache Spark 3.0 liefert erweiterte SQL-Funktionen und ein Update der Python-API

Data Science: Apache SystemDS 3.0 erhält ein Backend für Multi-Tenancy

Das neue Release der Data-Science-Software SystemDS führt ein Federated Backend für Mehrmandantenfähigkeit ein und vollzieht das Update auf Java 11 und Spark 3.

Machine Learning: Databricks gibt AutoML für den uneingeschränkten Einsatz frei

Der in die Databricks-Plattform integrierte Dienst AutoML soll Data Scientists helfen, ML-Modelle schneller produktionsreif zu entwickeln.

PipelineDP: Differential Privacy Framework für das Python-Universum

Google und OpenMined machen die Vorzüge des differenzierten Datenschutzes auch der Python Developer Community als Open Source zugänglich.

Online-Workshop: Big-Data-Analysen mit Python und Spark

Online-Workshop: Skalierbare Data Science mit Python und Spark

Über die PySpark-API spricht man Spark aus eigenen Python-Programmen an, um so skalierbare Big-Data- und Machine-Learning-Analysen zu entwickeln.

Online-Workshop: Data Science mit Python und Spark

Daten sprechen Bände – holen Sie mehr aus Ihren Unternehmensdaten hraus mit Python und Apache Spark. 10 % Frühbucherrabatt bis 6. Oktober.

Big Data: JetBrains hat erste stabile Kotlin-API für Apache Spark fertiggestellt

Big Data: Apache Spark erhält erste stabile Kotlin-API

JetBrains hat die erste Hauptversion der Kotlin-API für Spark fertiggestellt. Sie gilt als Feature-komplett und soll kompatibel sein zu den Kern-APIs von Spark.

Online-Workshop: Data Science mit Python und Spark

Data Scientists lernen in diesem Kurs, skalierbare Big-Data- und ML-Analysen in Python auf Basis von Apache Spark zu entwickeln – Frühbucherrabatt bis 7.7.

Machine Learning: Sparklyr 1.6 erhält Zugriff auf Power Iteration Clustering

Über ein neues R-Interface können Spark-Anwender den Graph-Clustering-Algorithmus in ihren Datenanalyseprojekten direkt nutzen.

Big Data Tools: JetBrains-Plug-in für Apache Zeppelin verlässt die Preview-Phase

Die Erweiterung zum Zugriff auf Zeppelin Notebooks und für das Monitoring von Spark- und Hadoop-Anwendungen ist nun in Version 1.0 verfügbar.

NetApp Spot holt Big Data auf die Kubernetes-Welle

Als Serverless Container Engine soll Wave die Infrastrukturverwaltung für containerisierte Spark-Anwendungen auf Kubernetes vereinfachen.

Datenverarbeitung: Apache Spark 3.1 will zum Zen-Meister für Python werden

Unter dem Schlagwort Project Zen soll Spark den Einsatz von PySpark vereinfachen, um Python für die Analytics-Engine zu nutzen.

Databricks erhält Finanzspritze von einer Milliarde US-Dollar

Üppig ausgestattet mit Risikokapital bereitet sich das Unternehmen hinter dem Big-Data-Framework Apache Spark auf einen Börsengang vor.

.NET for Apache Spark verbindet .NET-Entwicklung mit der Big Data Engine

Microsoft stellt die erste Hauptversion des Open-Source-Pakets zur Verfügung und macht Spark-Anwendern die UDFs von .NET zugänglich.

Cloudera startet Cloud-nativen Dienst für Data Engineering

Die Tools für ETL-Prozesse, Data-Pipeline-Orchestrierung, Automatisierung und Monitoring sind als Spark-Service in die Cloudera Data Platform integriert.

Datenanalyse: JetBrains stellt Kotlin-API für Apache Spark vor

Das Open-Source-Projekt will eine Kompatibilitätsschicht zwischen der Programmiersprache Kotlin und dem Big-Data-Framework Apache Spark bieten.

Online-Workshop: Big-Data-Analysen mit Python und Spark

Lernen Sie, wie Sie Apache Spark für Big-Data-Analysen aus Python-Programmen heraus nutzen. Bei Buchung bis 21.8. winken 10% Frühbucherabatt.

Apache Spark 3.0 liefert erweiterte SQL-Funktionen und ein Update der Python-API

Das Major-Release der Big-Data-Engine hat viele Verbesserungen, aber auch neue Ansätze im Gepäck, die höhere Performance und mehr Kompatibilität versprechen.

Big Data Tools: JetBrains gibt Plug-in für IntelliJ, PyCharm und DataGrip frei

Nutzer der IDEs erhalten über das Plug-in direkten Zugriff auf Zeppelin Notebooks, Spark-Anwendungen sowie Dateien auf S3-Speicherinstanzen

Nvidia stimmt CUDA 11 auf die Ampere-GPU-Architektur ab

Die neue Hauptversion von Nvidias Programmierplattform bietet zahlreiche neue Funktion für GPU-beschleunigte Anwendungen auf Basis der Ampere-GPUs.

nach oben

Alle Angebote

Newsletter heise-Bot

${intro} ${title}

${intro} ${title}

Apache Spark

Neueste Artikel zum Thema

Data Science: Cloudera startet All-in-one-Datendienst in der Cloud

Machine Learning: SynapseML automatisiert .NET-Anbindung an Apache Spark

heise+ Aktionsangebot

JetBrains' Big Data Tools 1.6 behalten Flink-Jobs im Auge

Data Science: Apache SystemDS 3.0 erhält ein Backend für Multi-Tenancy

Machine Learning: Databricks gibt AutoML für den uneingeschränkten Einsatz frei

PipelineDP: Differential Privacy Framework für das Python-Universum

Online-Workshop: Skalierbare Data Science mit Python und Spark

Online-Workshop: Data Science mit Python und Spark

Big Data: Apache Spark erhält erste stabile Kotlin-API

Online-Workshop: Data Science mit Python und Spark

Machine Learning: Sparklyr 1.6 erhält Zugriff auf Power Iteration Clustering

Big Data Tools: JetBrains-Plug-in für Apache Zeppelin verlässt die Preview-Phase

NetApp Spot holt Big Data auf die Kubernetes-Welle

Datenverarbeitung: Apache Spark 3.1 will zum Zen-Meister für Python werden

Databricks erhält Finanzspritze von einer Milliarde US-Dollar

.NET for Apache Spark verbindet .NET-Entwicklung mit der Big Data Engine

Cloudera startet Cloud-nativen Dienst für Data Engineering

Datenanalyse: JetBrains stellt Kotlin-API für Apache Spark vor

Online-Workshop: Big-Data-Analysen mit Python und Spark

Apache Spark 3.0 liefert erweiterte SQL-Funktionen und ein Update der Python-API

Big Data Tools: JetBrains gibt Plug-in für IntelliJ, PyCharm und DataGrip frei

Nvidia stimmt CUDA 11 auf die Ampere-GPU-Architektur ab