Was ist Open Source?

Der Begriff Open Source (kurz OS oder OSS) kennzeichnet Software, deren Quelltext öffentlich zugänglich ist und von Jedem eingesehen, geändert und genutzt werden kann. Die meiste Open-Source-Software kann kostenlos genutzt werden.

Das Gegenteil von Open Source ist Closed Source. Der Quellcode dieser Software ist nicht öffentlich zugänglich und darf nicht geändert, genutzt oder weitergegeben werden. Sie wird mithilfe von Lizenzen kommerziell vertrieben.

Unterschied von Open Source und Freeware

Freeware (von Englischen free software) bezeichnet Software, welche vom Urheber kostenlos zur freien Verfügung gestellt wird. Der Quellcode ist aber nicht frei zugänglich und darf nicht verändert oder verbreitet werden. Darin liegt der Unterschied zu OSS.

Vorteile von Open Source

Niedrige Kosten

Die meiste Open-Source-Software ist kostenlos zugänglich. Und selbst kostenpflichtige OSS ist im Vergleich zu Closed-Software-Alternativen größtenteils wesentlich günstiger.

Unabhängigkeit von kommerziellen Anbietern

Software von kommerziellen Anbietern verfolgt deren Unternehmensziele. Damit besteht eine gewisse Abhängigkeit, wodurch vor allem Probleme entstehen können, wenn die Software nicht mehr genügend Gewinn einbringt. In den meisten Fällen wird die Software vom Hersteller mit der Zeit nicht mehr unterstützt oder angeboten und der Kunde muss nach Alternativen suchen.

Bei Open Source gibt es dieses Problem nicht in diesem Umfang, weil keine, oder nur eine geringe Monetarisierung vorliegt.

Individualität

Da der Code jederzeit editierbar ist, ist er auch jederzeit individualisierbar. Es ist möglich, unnötige Funktionen zu löschen oder noch fehlende hinzuzufügen. Somit können individuell passende Lösungen gesucht und vorangetrieben werden.

Dies ist entweder mithilfe eigener Expertise, durch die Unterstützung der Community oder mit kommerziellen Experten möglich.

Kompatibilität

Der Ausschluss von Mitbewerbern durch eigene Datenformate und Systeme ist für Open Source eher hinderlich, daher wird viel Wert auf Interoperabilität (ein System hat die Fähigkeit, mit anderen Systemen zu kooperieren) gelegt. Dadurch gibt es bei Open Source viel seltener Kompatibilitätsprobleme als bei Closed Source.

Sicherheit

Dadurch, dass der Code durch viele, teils sehr gute, Entwickler mehrfach geprüft wird, fallen Fehler und Sicherheitslücken schnell auf. Bei Closed Source dauert es meist länger.

Nachteile von Open Source

Abhängigkeit von einer aktiven Community

Es besteht kein Anspruch auf eine Garantie oder Support gegenüber eines Herstellers, wie bei Closed-Source-Anwendungen. Daher besteht bei Open Source eine gewisse Abhängigkeit von einer aktiven Community, in Hinsicht auf Unterstützung und Weiterentwicklung.

Hoher Schulungs- und Wissensaufwand

OSS ist meist für Laien nicht so bekannt und einsteigerfreundlich, wie die weit verbreiteten kommerziellen Produkte. Dadurch benötigt die Nutzung von OSS oftmals mehr Einarbeitung, Schulung und Expertise.

Was ist beliebte Open-Source-Software als Business-Lösung?

Für ETL, Reporting, OLAP/Analysis und Data-Mining

Pentaho von Hitachi Vantara bietet eine Sammlung an Business-Intelligence-Software an, welche in der Basisversion kostenlos sind. Es werden Lösungen für die Bereiche ETL, Reporting, OLAP/Analysis und Data-Mining bereitgestellt.

Pentaho Data Integration (kurz PDI) bietet als ETL-Werkzeug Verbindungsmöglichkeiten zu unterschiedlichen Datenbanken. Durch weitere Plug-ins sind auch Verbindungen zu anderen Systemen möglich, wie zum Beispiel zu SAP mithilfe von ProERPconn und zu Navision mit dem Plug-in NaviX Table. Auch Big-Data-Verarbeitung zählt Pentaho Data Integration zu seinen Stärken.

Pentaho BI Suite bietet eine der wenigen Business-Intelligence-Lösungen im Open-Source-Bereich an.

Für Data Virtualization

Data Virtualization (im Deutschen Datenvirtualisierung) kann als Gegensatz zum ETL-Prozess gesehen werden, da die Daten in ihren ursprünglichen Systemen bleiben und die Virtualisierungskomponente direkt darauf zugreift und zur Nutzung bereitstellt.

Denodo Express von Denodo Technologies Inc. bietet eine Open-Source-Lösung zur Data Virtualization an. Es verbindet und integriert lokale und cloudbasierte Datenquellen, sowie Big Data, miteinander. Diese Daten werden Endbenutzern, Unternehmensanwendungen, Dashboards, Portalen, Intranet-, Such- und anderen Tools zur Verfügung gestellt.

Auch OpenLooKeng von Huawei ist seit Mitte 2020 als Open Source verfügbar und bietet einheitliche SQL-Schnittstellen für den Zugriff auf unterschiedliche Datenquellen.

Für Data Labeling

Data Labeling ist essenziell für Maschinelles Lernen, da es die vorhanden Daten mit den benötigten Merkmalen versieht, zum Beispiel, ob ein Bild eine Person zeigt oder nicht.

Es gibt einige Data-Labeling-Tools als Open Source. Dabei sind manche auf bestimmte Dateiformate spezialisiert und andere können alle verarbeiten.

Beispiele für Data-Labeling-Tools nur für Bilder:

  • bbox-visualizer
  • CVATT
  • hover
  • Labelme
  • Yolo-mark

Beispiele für Data-Labeling-Tools nur für Text:

  • dataqa
  • Hubdoccano

Beispiele für Data-Labeling-Tools für Audio, Bilder und Text:

  • awesome-data-labelling
  • Label-studio