Machine Learning kann Quellcode dem Autor zuweisen
Quelle: Microsoft

Machine Learning kann Quellcode dem Autor zuweisen

Forscher haben mittels Machine Learning eine Methode gefunden, um Programmcode dem jeweiligen Autoren zuzuordnen. Dies ist möglich, weil jeder Programmierer einen eigenen Stil hat und im Quellcode seine persönliche Handschrift hinterlässt.
14. August 2018

     

US-amerikanische Wissenschaftlerinnen haben eine Methode entwickelt, um Programmcode dem jeweiligen Autoren zuzuordnen. Wie "Wired" berichtet, haben Rachel Greenstadt, Professorin für Informatik an der Drexel University, und Aylin Caliskan, eine ehemalige Doktorandin von Greenstadt, die heute als Assistenzprofessorin an der George Washington University lehrt, herausgefunden, dass jeder Programmierer einen eigenen Programmierstil hat, der sich wie eine persönliche Handschrift im Quellcode widerspiegelt.

Im Rahmen der Hacker-Konferenz Def Con wollen die beiden Forscherinnen erläutern, wie Machine-Learning-Algorithmen in der Lage sind, den individuellen Stil eines Programmierers zu erkennen und diesem zuzuordnen, selbst wenn der Programmcode kompiliert ist. An rund 50 Merkmalen im Quellcode und an dessen Struktur lässt sich laut Greenstadt und Caliskan erkennen, wer diesen verfasst hat. Damit der Algorithmus den Stil erkennen kann, braucht er jedoch eine Probe des Programmierers, weshalb sich gänzlich unbekannte Autoren nicht ausfindig machen lassen. Die Methode scheint sehr gut zu funktionieren, war der Algorithmus doch in der Lage, 96 von 100 Programmierern zu identifizieren, während bei einer Versuchsreihe mit 600 Autoren immerhin noch 83 Prozent von ihnen korrekt zugeordnet wurden.


Die Methode der beiden Forscherinnen könnte verwendet werden, um Plagiate aufzudecken, jedoch auch, um anonym bleiben wollende Entwickler zu enttarnen, was wiederum problematisch sein könnte aufgrund der möglichen Verletzung ihrer Privatsphäre. (luc)


Weitere Artikel zum Thema

Tensorflow nun offiziell für Raspberry Pi erhältlich

7. August 2018 - Die neueste Version von Googles Machine-Learning-Plattform Tensorflow ist nun offiziell für Raspbian 9 erhältlich und somit auf der Raspberry-Pi-Plattform nutzbar.

Google: Maschinelles Lernen für die Werbung

11. Juli 2018 - Google lanciert neue Features für Werbetreibende. Google Werbung wird in Zukunft Machine Learning integrieren und selbst merken, welche Inhalte bei den Verbrauchern am besten ankommen.

Machine Learning von Apple in der zweiten Version

6. Juni 2018 - Apple hat an der World Wide Developers Conference die neue Version des Machine-Learning-Programmes vorgestellt, welches bessere Performance und mehr Optionen verspricht.


Artikel kommentieren
Kommentare werden vor der Freischaltung durch die Redaktion geprüft.

Anti-Spam-Frage: Wie hiess im Märchen die Schwester von Hänsel?
GOLD SPONSOREN
SPONSOREN & PARTNER