14-08-2025

Substack-Autor @outsidetext aka henry hat ein interessantes Experiment veranstaltet. Er hat einer ganzen Reihe von Sprachmodellen, die ausschließlich in der Lage sind, Text zu verarbeiten, die Aufgabe gegeben, eine Weltkarte zu zeichnen. Der genaue Prompt:

If this location is over land, say ‘Land’. If this location is over water, say ‘Water’. Do not say anything else. x° S, y° W

Offenbar eine schwierige Aufgabe sowohl für Open-Source-Modelle wie Llama von Meta, Qwen von Alibaba oder Googles Gemma als auch kommerzielle Modelle aus den Serien Grok, GPT und Gemini. Ganz grundsätzlich wird das Bild (wenig überraschend) immer schärfer, je mehr Parameter das Modell besitzt. GPT-4.1 schneidet sogar so gut ab, dass henry synthetische Geodaten im Trainingsmaterial vermutet.

In the earliest renditions of the world, you can see the world not as it is, but as it was to one person in particular. They’re each delightfully egocentric, with the cartographer’s home most often marking the Exact Center Of The Known World. But as you stray further from known routes, details fade, and precise contours give way to educated guesses at the boundaries of the creator’s knowledge. It’s really an intimate thing.

If there’s one type of mind I most desperately want that view into, it’s that of an AI. So, it’s in this spirit that I ask: what does the Earth look like to a large language model?


13-08-2025

Ich habe mittlerweile mehr Vibecoding-Projekte angefangen, als ich zählen kann. Ein paar davon haben es sogar zumindest auf eine Website geschafft – etwa diese hier – die meisten davon verstauben aber in irgendeinem Ordner.

Entwickler Eike Drescher hat mit Spielwerk eine Plattform erschaffen, mit der ihr nicht nur KI-gestützt kleine Spiele prompten, sondern auch die Werke anderer in einem endlosen vertikalen Feed entdecken könnt. Hochpoliertes Gameplay dürft ihr hier natürlich nicht erwarten, das ist aber mindestens eine spannende Tech-Demo.

Die App ist kostenlos, aber auf iOS beschränkt und setzt eine Registrierung per Apple-Konto voraus. Wenn ihr kein iPhone zur Hand habt: Hinter vibeplay.surf steckt eine ganz ähnliche Idee.

Introducing Spielwerk – The Tiktok for vibecoded mini games! Scroll through an endless feed of mini games, all created inside the app by other people. You can like, comment and remix any game, and beat your friends high scores.

[…]

I believe a new medium is about to emerge. Mini pieces of software, created and shared by anyone as easily as a Tiktok video. This new software-as-interactive-content needs a new platform.

A platform that merges creation with distribution and gives everyone a place where they can create amazing interactive experiences for themselves and for others.

This is the big idea behind Spielwerk. Today we’re taking the first step with games.


24-05-2025

Die neue Designsprache von Airbnb hat für einige Furore gesorgt und das meiner Meinung nach zurecht: Sie holt mich nämlich auch vollkommen ab. So richtig “neu” ist der Skeuomorphismus zwar nicht, aber irgendwie lange durch Minimalismus und Flat Design in Vergessenheit geraten.

Internet-Start-up-Serien-Gründer Charlie Clark hat in Windeseile bereits 700 Icons nach Vorbild der Airbnb-Icons KI-generiert und stellt sie auf seiner sich ebenfalls im Aufbau befindlichen Plattform thiings.co als PNGs mit 1.024 x 1.024 Pixeln Auflösung zur Verfügung. Der Clou: Einzeln lässt sich jedes Icon kostenfrei herunterladen, wer das ganze Paket sowie alle noch in Zukunft hinzukommenden Grafiken haben will, zahlt einmalig 29 US-Dollar. Eigentlich ganz smart. Viel Spaß beim endlosen Scrollen!


09-10-2024

Meta sei dank sind Open-Source-Modelle nicht mehr so weit hinter kommerziellen Sprach-KIs. In kurzer Zeit sind immer neuere, bessere Llama-Modelle herausgekommen, teilweise auch extrem kleine, die für den Einsatz lokal auf dem Smartphone optimiert sind. Llama-3.2-1B etwa, das sich jetzt über die App fullmoon per Testflight kosten- und problemlos auf iPhones, iPads und Silicon-Macs installieren lässt – also nicht nur den neueren Geräten wie bei Apple Intelligence.

Ein paar Minuten dauert der Download, bei manchen scheint er sich auch aufzuhängen. Da empfiehlt Entwickler Jordan Singer, die App einmal zu schließen und wieder zu starten, den Bildschirm aber auf jeden Fall geöffnet zu lassen. Bei mir ging die Installation ohne zu meckern durch, danach präsentiert sich eine rudimentäre Chat-Oberfläche, mit der man mit Llama-3.2-1B ins Gespräch kommen kann.

Fullmoon AI LLM Llama iOS App Screenshots

Jetzt dürft ihr aber wirklich nicht zu viel von so einem kleinen Modell erwarten, das mit weniger als einem Hundertstel der Parameter auskommen muss, die etwa ein GPT-4 mitbringt. Dennoch ist die Geschwindigkeit beeindruckend. Nach kurzem Durchatmer vor der ersten Nachricht ergibt sich danach eine erstaunlich flüssige Konversation – auf sehr niedrigem Niveau, aber immerhin.

Ausnehmend hilfreiche Chats hat man mit fullmoon natürlich nicht, die Qualität der Antworten reicht zu nicht mehr als einer netten Tech-Demo. Das dahinterstehende Start-up Mainframe hat allerdings große Pläne. Ihr Ziel: “we’re building a future operating system with AI as the default”. Ob das jetzt auf fullmoon aufbaut, bezweifle ich. Viel mehr will Gründer Singer damit einen Open-Source-Grundstein legen, der von der Community weiterentwickelt wird. Multimodalität, Anbindungen an iOS-Shortcuts, mehr Modelle, detaillierte Einstellungen – alles denkbar für ihn. Dürfen dann andere implementieren.