14-08-2025

Substack-Autor @outsidetext aka henry hat ein interessantes Experiment veranstaltet. Er hat einer ganzen Reihe von Sprachmodellen, die ausschließlich in der Lage sind, Text zu verarbeiten, die Aufgabe gegeben, eine Weltkarte zu zeichnen. Der genaue Prompt:

If this location is over land, say ‘Land’. If this location is over water, say ‘Water’. Do not say anything else. x° S, y° W

Offenbar eine schwierige Aufgabe sowohl für Open-Source-Modelle wie Llama von Meta, Qwen von Alibaba oder Googles Gemma als auch kommerzielle Modelle aus den Serien Grok, GPT und Gemini. Ganz grundsätzlich wird das Bild (wenig überraschend) immer schärfer, je mehr Parameter das Modell besitzt. GPT-4.1 schneidet sogar so gut ab, dass henry synthetische Geodaten im Trainingsmaterial vermutet.

In the earliest renditions of the world, you can see the world not as it is, but as it was to one person in particular. They’re each delightfully egocentric, with the cartographer’s home most often marking the Exact Center Of The Known World. But as you stray further from known routes, details fade, and precise contours give way to educated guesses at the boundaries of the creator’s knowledge. It’s really an intimate thing.

If there’s one type of mind I most desperately want that view into, it’s that of an AI. So, it’s in this spirit that I ask: what does the Earth look like to a large language model?


09-10-2024

Meta sei dank sind Open-Source-Modelle nicht mehr so weit hinter kommerziellen Sprach-KIs. In kurzer Zeit sind immer neuere, bessere Llama-Modelle herausgekommen, teilweise auch extrem kleine, die für den Einsatz lokal auf dem Smartphone optimiert sind. Llama-3.2-1B etwa, das sich jetzt über die App fullmoon per Testflight kosten- und problemlos auf iPhones, iPads und Silicon-Macs installieren lässt – also nicht nur den neueren Geräten wie bei Apple Intelligence.

Ein paar Minuten dauert der Download, bei manchen scheint er sich auch aufzuhängen. Da empfiehlt Entwickler Jordan Singer, die App einmal zu schließen und wieder zu starten, den Bildschirm aber auf jeden Fall geöffnet zu lassen. Bei mir ging die Installation ohne zu meckern durch, danach präsentiert sich eine rudimentäre Chat-Oberfläche, mit der man mit Llama-3.2-1B ins Gespräch kommen kann.

Fullmoon AI LLM Llama iOS App Screenshots

Jetzt dürft ihr aber wirklich nicht zu viel von so einem kleinen Modell erwarten, das mit weniger als einem Hundertstel der Parameter auskommen muss, die etwa ein GPT-4 mitbringt. Dennoch ist die Geschwindigkeit beeindruckend. Nach kurzem Durchatmer vor der ersten Nachricht ergibt sich danach eine erstaunlich flüssige Konversation – auf sehr niedrigem Niveau, aber immerhin.

Ausnehmend hilfreiche Chats hat man mit fullmoon natürlich nicht, die Qualität der Antworten reicht zu nicht mehr als einer netten Tech-Demo. Das dahinterstehende Start-up Mainframe hat allerdings große Pläne. Ihr Ziel: “we’re building a future operating system with AI as the default”. Ob das jetzt auf fullmoon aufbaut, bezweifle ich. Viel mehr will Gründer Singer damit einen Open-Source-Grundstein legen, der von der Community weiterentwickelt wird. Multimodalität, Anbindungen an iOS-Shortcuts, mehr Modelle, detaillierte Einstellungen – alles denkbar für ihn. Dürfen dann andere implementieren.