Data Science: Cloudera startet All-in-one-Datendienst in der CloudDie Cloudera Data Platform One bündelt alle für Datenanalyse und -erkundung erforderlichen Tools als Software-as-a-Service auf Basis der Lakehouse-Architektur.
Machine Learning: SynapseML automatisiert .NET-Anbindung an Apache SparkMit dem neuen API-Satz ermöglicht Microsofts ML-Bibliothek den Sprachen der .NET-Familie wie C# und F# verteiltes Machine Learning mit Apache Spark.
heise+ Aktionsangebot 1 Jahr heise+ zum Aktionspreis: Jetzt heise+ für nur 1,90 € pro Woche lesen und 1 Jahr lang geballtes, brandaktuelles IT- und Tech-Wissen sichern. Unbegrenzter Zugriff auf alle heise+ Beiträge inklusive der Inhalte aller Heise-Magazine. Nur bis zum 31. Mai!
JetBrains' Big Data Tools 1.6 behalten Flink-Jobs im AugeDie Big Data Tools 1.6, ein Plug-in für Zugriff auf Zeppelin Notebooks, beherrscht nun auch das Monitoring von Apache Flink und bindet den Hive Metastore ein.
Data Science: Apache SystemDS 3.0 erhält ein Backend für Multi-TenancyDas neue Release der Data-Science-Software SystemDS führt ein Federated Backend für Mehrmandantenfähigkeit ein und vollzieht das Update auf Java 11 und Spark 3.
Machine Learning: Databricks gibt AutoML für den uneingeschränkten Einsatz freiDer in die Databricks-Plattform integrierte Dienst AutoML soll Data Scientists helfen, ML-Modelle schneller produktionsreif zu entwickeln.
PipelineDP: Differential Privacy Framework für das Python-UniversumGoogle und OpenMined machen die Vorzüge des differenzierten Datenschutzes auch der Python Developer Community als Open Source zugänglich.
Online-Workshop: Skalierbare Data Science mit Python und SparkÜber die PySpark-API spricht man Spark aus eigenen Python-Programmen an, um so skalierbare Big-Data- und Machine-Learning-Analysen zu entwickeln.
Online-Workshop: Data Science mit Python und SparkDaten sprechen Bände – holen Sie mehr aus Ihren Unternehmensdaten hraus mit Python und Apache Spark. 10 % Frühbucherrabatt bis 6. Oktober.
Big Data: Apache Spark erhält erste stabile Kotlin-APIJetBrains hat die erste Hauptversion der Kotlin-API für Spark fertiggestellt. Sie gilt als Feature-komplett und soll kompatibel sein zu den Kern-APIs von Spark.
Online-Workshop: Data Science mit Python und SparkData Scientists lernen in diesem Kurs, skalierbare Big-Data- und ML-Analysen in Python auf Basis von Apache Spark zu entwickeln – Frühbucherrabatt bis 7.7.
Machine Learning: Sparklyr 1.6 erhält Zugriff auf Power Iteration ClusteringÜber ein neues R-Interface können Spark-Anwender den Graph-Clustering-Algorithmus in ihren Datenanalyseprojekten direkt nutzen.
Big Data Tools: JetBrains-Plug-in für Apache Zeppelin verlässt die Preview-PhaseDie Erweiterung zum Zugriff auf Zeppelin Notebooks und für das Monitoring von Spark- und Hadoop-Anwendungen ist nun in Version 1.0 verfügbar.
NetApp Spot holt Big Data auf die Kubernetes-WelleAls Serverless Container Engine soll Wave die Infrastrukturverwaltung für containerisierte Spark-Anwendungen auf Kubernetes vereinfachen.
Datenverarbeitung: Apache Spark 3.1 will zum Zen-Meister für Python werdenUnter dem Schlagwort Project Zen soll Spark den Einsatz von PySpark vereinfachen, um Python für die Analytics-Engine zu nutzen.
Databricks erhält Finanzspritze von einer Milliarde US-DollarÜppig ausgestattet mit Risikokapital bereitet sich das Unternehmen hinter dem Big-Data-Framework Apache Spark auf einen Börsengang vor.
.NET for Apache Spark verbindet .NET-Entwicklung mit der Big Data EngineMicrosoft stellt die erste Hauptversion des Open-Source-Pakets zur Verfügung und macht Spark-Anwendern die UDFs von .NET zugänglich.
Cloudera startet Cloud-nativen Dienst für Data EngineeringDie Tools für ETL-Prozesse, Data-Pipeline-Orchestrierung, Automatisierung und Monitoring sind als Spark-Service in die Cloudera Data Platform integriert.
Datenanalyse: JetBrains stellt Kotlin-API für Apache Spark vorDas Open-Source-Projekt will eine Kompatibilitätsschicht zwischen der Programmiersprache Kotlin und dem Big-Data-Framework Apache Spark bieten.
Online-Workshop: Big-Data-Analysen mit Python und SparkLernen Sie, wie Sie Apache Spark für Big-Data-Analysen aus Python-Programmen heraus nutzen. Bei Buchung bis 21.8. winken 10% Frühbucherabatt.
Apache Spark 3.0 liefert erweiterte SQL-Funktionen und ein Update der Python-APIDas Major-Release der Big-Data-Engine hat viele Verbesserungen, aber auch neue Ansätze im Gepäck, die höhere Performance und mehr Kompatibilität versprechen.
Big Data Tools: JetBrains gibt Plug-in für IntelliJ, PyCharm und DataGrip freiNutzer der IDEs erhalten über das Plug-in direkten Zugriff auf Zeppelin Notebooks, Spark-Anwendungen sowie Dateien auf S3-Speicherinstanzen
Nvidia stimmt CUDA 11 auf die Ampere-GPU-Architektur abDie neue Hauptversion von Nvidias Programmierplattform bietet zahlreiche neue Funktion für GPU-beschleunigte Anwendungen auf Basis der Ampere-GPUs.