Die Programmiersprache R wurde speziell für statistische Berechnungen entwickelt. Sie wird von den meisten Statistikern und Data Miners verwendet, die sie für die statistische Datenverarbeitung nutzen. Die Programmiersprache R wurde hauptsächlich in C geschrieben und enthält im Kern auch Fortran und R. Sie kann kostenfrei im Rahmen der GNU General Public License heruntergeladen werden.
Sie hat viele Ähnlichkeiten mit der Programmiersprache S, die von Bell Laboratories entwickelt wurde. R bietet jedoch eine Vielzahl von linearen und nicht linearen Modellierungen, Analyse von Zeitreihen, Clustering und kann umfassend erweitert werden. Während S derzeit die bevorzugte Option für die Erforschung der statistischen Analyse ist, konkurriert R stark um den Titel als Programmiersprache der ersten Wahl. R ist vollständig Open-Source und wird schnell immer beliebter, da sie Plots produzieren kann, die aufgrund ihrer hohen Qualität zur Veröffentlichung bereitstehen.
R kann als interpretierte Sprache eingestuft werden. Normalerweise erfolgt der Zugriff über einen Kommandozeileninterpreter, aber sie ist auch als vorkompilierte ausführbare Datei vorhanden und kann auf mehreren Betriebssystemen einschließlich Windows und MacOS ausgeführt werden. R unterstützt zahlreiche arithmetische Funktionen, einschließlich der Matrix-Arithmetik.
R verfügt über mehrere gängige Datenstrukturen wie Arrays und Listen. Arrays werden von dem System als Spalten-Großauftrag gespeichert und können als homogene Komponenten betrachtet werden. Listen bestehen aus heterogenen Elementen und können als generischer Typ betrachtet werden. Während der Arrayspeicher statisch ist, ist der Listenspeicher dynamisch und zufällig.
Viele der Funktionen der Programmiersprache R wurden von Scheme abgeleitet. Daten werden genauso dargestellt wie in S, und alle Funktionen sind herausragend. Sie können Funktionen auf die gleiche Art und Weise wie Datenobjekte behandeln. Dies ermöglicht die Multimethode, was die Geschwindigkeit und Effizienz erheblich erhöht.
Die Effizienz wird auch dadurch gesteigert, dass Funktionsargumente als Wert anstatt als Verweis dargestellt werden. Diese Argumente werden auch langsam dargestellt, so dass sie immer nur dann implementiert werden, wenn sie verwendet werden, und nicht dann, wenn die Funktion aufgerufen wird. R nutzt die prozedurale Programmierung mit Funktionen und kann auch eine objektorientierte Programmierung mit generischen Funktionen implementieren.
Während R komplett Open-Source und kostenfrei verfügbar ist, bieten viele Unternehmen kommerzielle Unterstützung und Erweiterungen des Pakets an. Unternehmen wie Microsoft haben R in ihre Projekte integriert. Microsoft hat R in die Suite von SQL Server-Anwendungen und Visual Studio integriert. IBM bietet ein Programmiermodell für parallele In-Database-Analysen an. R wird jeden Tag aktualisiert und verbessert. Dies wird wohl auch in Zukunft so sein.