KI verstehen » Tools nutzen

KI ist die deutsche Abkürzung für Künstliche Intelligenz, während AI die englische Abkürzung für Artificial Intelligence ist. Beides sind zunächst “Marketing-Begriffe”. Dahinter steht aber ein grundlegender technischer Wandel mit gravierenden Änderungen in unser aller Leben.

Darüber wurde schon 1950 nachgedacht, seit 1980 sehr konkret auch in Deutschland geforscht und Anfang 2000 wurden lauffähige, künstliche neuronale Netze geschaffen, da die Computer inzwischen genug Rechenleistung boten. 2022 startet ChatGPT und löste bei einigen einen Hype und anderen Abwehr aus. Jedenfalls sind die Veränderungen konkrete Realität geworden. Und sie sind mindestens so einschneidend wie die Erfindung der Dampfmaschine, der maschinellen Webstühle … und mehr als das Internet oder SocialMedia. Für mich war die Zeit gekommen genauer, tiefer und konkreter hinzuschauen.

Ich stelle hier kurz die Fähigkeiten von KI-Arten vor, viele aktuelle Tools und beschreibe Nutzungsmöglichkeiten.

Begriffsbestimmungen

[oder direkt zu den Tools springen]

  • einfache KI = Anwendung von Algorithmen. Das macht SocialMedia, wenn uns Beiträge vorgeschlagen oder aus einem Bild das Rauschen glattgerechnet wird.
  • Sportlicher wird es mit ML Maschinen Learning = Diese immer noch statischen Algorithmen können aus Mustern Bilder erkennen, zum Beispiel ein Gesicht oder den Unterschied zwischen einem Zebra und Esel. Dazu müssen sie trainiert werden. Dann kann aber auch ein Chip in der Kamera das Auge bei einem Vogel erkennen und darauf scharf stellen.
  • Richtig spannend wird es mit generativer KI = Sie kann unstrukturierte Daten auswerten und eigene Ergebnisse erstellen, also Texte formulieren oder Bilder erzeugen. Open Ai hat am 30. November 2022 ChatGPT veröffentlich. Mit den aktuellen Modellversionen wie GPT-4 und GPT-4o, teilweise gratis und auch als Abo-Bezahlversion.
  • Dabei steht GPT für “Generative Pre-trained Transformer”.
    Generative: Das Modell kann neue Inhalte erstellen/generieren (Texte, Antworten, Ideen)
    Pre-trained: Es wurde im Voraus auf riesigen Mengen an Textdaten trainiert, bevor es für spezifische Aufgaben eingesetzt wird
    Transformer: Das ist die zugrundeliegende Architektur/Technologie – ein neuronales Netzwerk, das besonders gut darin ist, Zusammenhänge in Texten zu verstehen und zu verarbeiten.

Inzwischen gibt es viele konkurrierende Anbieter und Modelle, die spezielle Fähigkeiten und unterschiedlich stark ausgeprägt haben:

  • NLP steht für “Natural Language Processing” (Natürliche Sprachverarbeitung). Es ermöglicht Maschinen, menschliche Sprache zu verstehen, zu interpretieren und zu generieren. Von der Spracherkennung: Umwandlung von gesprochener Sprache in geschriebenen Text. Bis zur Fähigkeit mit Benutzern in natürlicher Sprache interagieren zu können.
  • Webserach / Deepsearch können noch nicht alle LLM – zumindest in der kostenlosen Version. Sie erlaubt es der KI, aktuell im Internet nach Informationen zu suchen.
  • Embedding versieht Text mit Vektoren, um Textähnlichkeiten und Bedeutung zu erkennen: Findet also zu “Fahrrad reparieren” auch Texte die “Bike-Wartung” behandeln
  • Reasoning bezeichnet logisches Schlussfolgern und komplexe Denkprozesse. LLMs müssen dabei: Mehrere Schritte abarbeiten und verknüpfen, logische Schlüsse ziehen, Probleme systematisch lösen, Ursache-Wirkungs-Beziehungen verstehen.

Was noch nicht so wirklich funktioniert sind die Fähigkeiten einer KI sich in die echte physikalische Welt zu denken. Frage: Klaus wirft erst einen roten Ball 3 Meter hoch, dann einen grünen 4 Meter und legt sich dann einen gelben auf den Kopf. Welcher Ball ist am höchsten? Das LLM hat noch keine “Vorstellung” davon, dass der rote und grüne Ball inzwischen auf die Erde gefallen ist. Darum funktionieren Roboter mit KI schon in festgelegten Abläufen und Umgebungen, aber noch nicht autonom. [Aber auch daran arbeitet die Forschung DokuTipp:(noch) in der ARTE Mediathek, (schon) bei YouTube]

Im Umgang mit generativer KI bitte ich euch, zu bedenken:

KI denkt nicht in unserem biologisch, geistigen Sinne, sondern formuliert aufgrund statistischer Wahrscheinlichkeiten und ihren Trainingsdaten, ohne ein Verständnis für den Sinn des Inhalts. Sie kann sehr überzeugend falsche Antworten geben, phantasieren, Fake-News erzeugen. Sie kann Empathie sprachlich simulieren, aber nicht empfinden. Sie kann Regeln anwenden, aber keine Verantwortung übernehmen.   

Konsequenzen

KI / AI ist faszinierend. Sprachmodelle mit guter Silben- und Wordprognose gaukeln durch ihre Eloquenz Intelligenz vor. Diese Intelligenz liegt aber im Menschen, der die Eloquenz erkennt und mit echten Erfahrungen und Sinn füllen kann.
KI / AI ist ein Wekzeug, dass einige Aufgaben viel schneller erledigen kann und soll, insbesondere wenn sie für Menschen langweilig oder zeitraubend sind. Wie sollen / wollen wir in der Kirche mit KI umgehen?

Als Kirche richten wir unsere Arbeit aus auf den Menschen mit Körper, Geist und Seele und seine unterschiedlichen Bedürfnissen. Dafür nutzen wir die Möglichkeiten in dieser Welt. Darum fragen wir: Wo können uns KI-Tools helfen, unsere Arbeit einfacher, zuverlässiger, freudvoller und produktiver zu gestalten?
Ich möchte spielerische Neugierde, Teamwork und Reflexionsschritte, um gute Strukturen zu schaffen, damit KI-Tools unsere Arbeit unterstützen.

Die wichtigsten KI Tools (Auswahl):

Das Angebot wächst immer noch ständig, die einzelnen KI-Modelle lernen dazu und die Anbieter schauen sich Funktionen voneinander ab. Darum ist das Folgende nur ein Zwischenstand.

Suchen und Finden

Inzwischen listet Google-Chrome nicht nur Links auf zu meiner Suchanfrage, sondern meist auch schon KI-generierte Zusammenfassungen. Ich kann sogar wählen, ob der Microsoft Copilot, Google Gemini oder ChatGPT von OpenAI die Antwort formulieren soll.

Bei einer einfachen Frage kannst du der Schöpfung aber den Stromverbrauch der KI ersparen und einfach mit ecosia suchen :-).

Erweiterte Suche = Recherche

Perplexity
von Perplexity AI – USA – ist eine verfeinerte Suchmaschine und auf die Recherche ausgelegt. Sie fasst Ergebnisse als Chat zusammenfasst und liefert insbesondere die Quellenangaben mit. So kannst du leichter die Qualität der Antwort aufgrund der Quellen einschätzen. Sie ist mit Daten bis 2024 trainiert und kann auch direkt im Web suchen.

Sprachmodelle = aktuelle LargeLanguageModelle

ChatGPT
ist DER Klassiker von Open AI in den USA. Leicht über den Browser oder auch als APP zu nutzen. Zum Beispiel mit einer E-Mailadresse anmelden, Fragen / Aufgaben eintippen oder einsprechen also formulieren = prompten.

Claude.ai
von Anthropic in den USA. Auch über Browser oder App zum Beispiel mit dem Google-Konto anmelden. Bietet ein Archiv mit verschiedenen Chats. Das ist sehr übersichtlich. Innerhalb des Chat merkt sich das LLM ein Gespräch.
Spezialisiert auf Texte und Programmcode, kann auch Bilder erstellen, aber nicht überarbeiten.

Google-Gemini
von Alphabet Inc. in USA. Zugang geht immer über das Google Konto.
Kann auch Bilder erstellen, aber nicht überarbeiten
Bietet auch ein Archiv mit verschiedenen Chats. Kann inzwischen auch “Deep Research” = Reasoning und kann Ergebnisse zu einem Audio zusammenfassen.

Microsoft Co-Pilot
Microsoft ist an der NASDAQ USA gelistet. Der Zugang braucht nicht unbedingt ein Microsoft-Konto und ist auch in Microsoft Suchmaschine Bing integriert oder in Microsoft 365 Officepaket, kann auch Bilder erstellen, das aber nur mit Anmeldung.
In den Bezahlversionen kann es auch Datenschutz, aber noch nur nach USA-Standard.

Grok.com ist ein “böser” Chatbot von Elon Musk. Er neigt nicht dazu – wie die anderen LLMs – nett zu sein und dir zu schmeicheln, was auch mal erhellend sein kann. Er nutzt die Daten von Twitter / X, was andere auch nicht können. Diese Tweets prägen aber auch Groks Antworten und haben schon zu fragwürdigen und auch inakzeptablen Ergebnissen geführt. Unkritisch sollte man aber keines der LLMs nutzen -auch nicht mit Ethikfiltern.

DeepSeek.
ist ein fortschrittliches Sprachmodell, das als chinesische Antwort auf ChatGPT gehandelt wird und für verschiedene Aufgaben wie das Beantworten von Fragen, das Schreiben von Texten oder das Erstellen von Rezepten eingesetzt werden kann. Mit dem Datenschutz ist es ebenso vertrauens(un)würdig wie made in USA.

Datenschutzfragen:
Die genannten Modelle laufen alle auf außereuropäischen Servern und deren Datenschutzrichtlinien. Es gibt aber auch Angebote aus Europa:

Le Chat
ist ein KI-Assistent, der von Mistral AI entwickelt wurde. Mistral AI ist ein französisches Startup mit Hauptsitz in Paris, also Europa und DSGVO-konform. Die Daten werden auf Servern in Frankreich verarbeitet.

Lumo
ist ein KI-Chatbot vom Schweizer Software-Anbieter Proton. Du kannst sogar als Gast ohne Anmeldung Fragen stellen (Ghost-Modus) über den Browser oder die App. Die Dialoge werden verschlüsselt, nicht protokolliert und können deshalb auch an niemanden weitergegeben werden. Die Antworten können mit und ohne Webzugang erstellt werden und sind immer mit Quellenangaben versehen.
Du kannst auch eigene Datenquellen verschlüsselt hochladen, die Lumo dann für dich auswertet.

LLM plus

Googles NotebookLM ist ein intelligentes Recherche- und Organisationstool, das deine eigenen Dokumente als Wissensbasis nutzt.
Läuft im Browser und gibt es auch als APP. Anmelden mit Google-Konto.
Stärke: Texte erstellen und einfügen als Quelle, die dann als Wissens-Grundlage dienen.
Kann Zusammenfassungen erstellen durch Promtanweisung
z.B “Fasse die Quellen zusammen als Podcast mit drei TN, für Zielgruppe xy” » erzeugt Text-Script. Kann aber auch eine Art Podcastfolge von zwei SprecherInnen erstellen, eine Notiz, oder Mindmap etc

Notion aus den USA ist eine Plattform für Notizen und auch für das Projektmanagement geeignet. Es enthält einige KI Funktionen und kann mit notion ai als Abo aufgewertet werden. Zugang z.B. googlekonto, über Browser oder App

Julius
wurde 2022 von Rahul Sonwalkar gegründet mit Sitz in San Francisco (USA).
Die hochgeladenen Dateien und die Ergebnisse der Analysen werden laut Selbstaussage nicht zum Training seiner KI-Modelle verwendet und verschlüsselt gespeichert. Das Unternehmen ist nach Standards wie SOC 2 Type II zertifiziert und arbeitet aktiv daran, die GDPR-Konformität (Datenschutz-Grundverordnung) zu erfüllen.
Julius ist eine spezialisierte AI zur Auswertung und Aufbereitung von Daten. Sie kann Excel, CSV und PDF-Daten lesen, auswerten/analysieren und visualisieren.

Programmcode

Eine spezielle Form der Sprachausgabe ist das Erstellen von Programmcode. Das können HTML-Befehle und CSS-Stil-Anweisungen sein für einfache Webseiten, kann JavaScript und PHP beinhalten und auch Python, Java, C++ bedeuten.

  • GPT-4 von OpenAI: Dieses Modell gilt als einer der stärksten Allrounder im Bereich der Programmierung. Es ist sehr gut darin, komplexere Probleme zu verstehen, Code in einer Vielzahl von Sprachen zu schreiben, Fehler zu finden (Debugging) und sogar Code von einer Sprache in eine andere zu übersetzen.
  • Gemini von Google: Als Teil der neuen Generation großer Sprachmodelle sind auch die Gemini-Modelle sehr fähig in der Codegenerierung und -analyse. Sie sind darauf trainiert, über Code zu reasoning (zu folgern) und können oft effizienten und gut strukturierten Code produzieren.
  • Claude 3 von Anthropic: Dieses Modell ist besonders bekannt für sein sehr großes Kontextfenster. Das macht es ideal für Aufgaben, bei denen Sie große Codebasen oder umfangreiche Dokumentationen analysieren müssen. Es kann den Gesamtkontext eines Projekts besser im Blick behalten.

Die nächste Stufe sind KI-Modelle die Text to APP anbieten, also aus einer Promptanweisung Apps erstellen, ohne dir den Code zu liefern.

Derzeit bietet Google eine Betaversion von Opal.

CA (Cognitive Agents)

KI-Agents verbinden das Gehirn einer KI (neuronales Netzwerk) und nutzen LLMs, haben aber ein Gedächtnis und lassen sich verknüpfen mit Werkzeugen z.B. mit einem Google-Kalender, -Doc oder -Mail u.a., da sie über APIs mit anderer Software und deinem PC zusammenarbeiten und sogar telefonieren können.
Dabei kann es einen von dir definierten Workflow nicht nur abarbeiten, sondern selbstständig gestalten. So wird aus dem LLM Praktikanten eine KI-Mitarbeitende.

KI-Agents sind der Hype und inzwischen bietet auch ChatGPT PRO (im Bezahlabo) einen Agent, (der aber noch übt …)

Was schon funktioniert, aber auch datenschutzrechtlich bedacht werden muss:

Manus.im
Manus ist ein autonomer KI-Agent, der von dem Startup Monica aus China entwickelt wurde und in China betrieben wird. Ich kann mich mit Mail-Adresse anmelden, aber muss auch meine Handynummer angeben.
Tipps: https://www.youtube.com/watch?v=qNc0vhW7oFE&t=595s

Genspark
Das Unternehmen hinter Genspark, MainFunc, wurde 2023 von den beiden chinesischen Gründern Eric Jing und Kaihua Zhu gegründet. Obwohl beide zuvor leitende Positionen bei den chinesischen Unternehmen Baidu und Xiaodu innehatten, hat das Unternehmen seinen Hauptsitz in Palo Alto, Kalifornien (USA).
Es gibt einen koostenlosen Plan mit unbegrenzte Suchanfragen, aber der Zugang zu den KI-Agenten ist eingeschränkt. Der Plus-Plan (ab $24.99/Monat) ermöglicht den vorrangigen Zugang zu allen KI-Agenten.
Genspark kann Recherchen durchführen: Es analysiert und fasst Informationen aus verschiedenen Quellen zusammen.
Präsentationen erstellen: Genspark kann aus Textdokumenten oder Prompts Präsentationen mit ansprechenden Folien, Grafiken und Bildern generieren.
Inhalte erstellen: Es kann auch Bilder und Videos produzieren.
und Interaktionen in der realen Welt übernehmen und sogar Telefonanrufe tätigen, um beispielsweise eine Hotelreservierung vorzunehmen oder Umfragen durchzuführen.

n8n
von der n8n GmbH mit Sitz in Berlin.
Mit dieser Platform kannst du dir auch einen eigenen Ki-Agent zusammenstellen. n8n ist eine Open-Source-Plattform für Workflow-Automatisierung, mit der Unternehmen und Privatpersonen wiederkehrende Prozesse automatisieren können, ohne programmieren zu müssen. Nutzer können n8n selbst hosten, was vollständige Kontrolle über ihre Daten und die Sicherheitsmaßnahmen ermöglicht. Es gibt eine Testversion für 14-Tage, dann eine monatliche Abrechnung ab 20 €.
n8n arbeit zum Beispiel zusammen mit Hugging Face aber auch OpenAI API:

  • ChatGPT: Für natürliche Sprachverarbeitung und generative Texte.
  • Whisper: Für Spracherkennung und Transkription.
  • DALL·E: Für die Generierung von Bildern aus Textbeschreibungen.
    und Google Cloud AI:
  • Natural Language API: Für Textanalyse, Sentiment-Analyse und Entity Recognition
  • Vision API: Für die Analyse von Bildern und Videos.
  • Speech-to-Text und Text-to-Speech: Für Spracherkennung und Sprachsynthese.

Lokale KI auf deinem PC

Es gibt die Möglichkeit KI und Agents lokal zu installieren und laufen zu lassen. Gib mal in google ein: “Ki lokal installieren” und du wirst verwiesen auf Ollama, LM Studio oder Doker mit  OpenWebUI oder AnythingLLM. Man stößt dabei auch auf Hugging Face – die sehr große Plattform für KI-Modelle als Open-Source. (Mehr dazu ganz unten.)
Hier funktioniert der Datenschutz, aber du musst den leistungsstarken PC (4.000 €- 500.000 €) kaufen und den Stromverbrauch deiner PC-Anlage bezahlen.
Mehr: https://t3n.de/bildergalerie/ki-tools

Audio und Sprache

LLMs sind ja schon “Sprachmodelle” und haben oft auch eine Schnittstelle, um eingesprochene Texte zu transkribieren und die erstellten Texte vorzulesen. Aber es gibt Modelle, die auf die Audio-Text Schnittstelle spezialisiert sind.

Speech-to-Text:

  • Whisper: OpenAI’s Transkriptions-Modell, erreichbar über Hugging Face
  • Wav2Vec: Facebook’s Spracherkennungs-Modell

Text-to-Speech:

Eingeschränkt nutzbar sind:

  • TTSmaker liefert gute Online-Ergebnisse ist aber auf 1000 Zeichen begrenzt.
  • Luvvoice ist im kostenlosen Plan auf 3000 Zeichen begrenzt.
  • Tortoise TTS: Open-Source-Alternative über github oder Hugging Face. Es gibt eine Online-Version mit max 4000 Zeichen. Das Ergebnis ist … eher schrecklich.

Die echten Spezilisten:

  • Eleven Labs https://elevenlabs.io/de hat eine sehr natürliche Stimmsynthese. Es gibt ein kostenloses Einstiegsmodell (10 Minuten Text zu Speech pro Monat) und ein Starterpaket ab 5$ pro Monat (https://elevenlabs.io/de/pricing).
    Die Audiodatei (siehe hier) wurde mit dem kostenlosen Plan von ElevenLabs generiert.
  • Riversinde FM ist ein umfassendes Tool zum Aufzeichnen, Bearbeiten und Übersetzen von Audio, aber kann auch Texte in Audio mit deiner Stimme erstellen. Kosten ab 15 € im Monat.
Dieser Blogbeitrag als Audio – erstellt mit kostenlosem Plan von Eleven Labs
1000 Zeichen aus diesem Beitrag mit TTSmaker

Musik und Sound

Manchmal braucht man ja nur ein Geräusch oder kleine Melodie 🙂 freesound.org oder BBC Sound Effects oder Zapsplat oder
Klassische Musik mit erloschenen Urheberrechten
musopen.org

Musik generieren:

Suno kann Musik und Lieder in verschiedenen Stilen erstellen.
Einfach einen Text schreiben (oder mit ChatGPT o.ä. erstellen), dann einfügen unter ERSTELLEN – Musikstil auswählen, Titel eingeben … etwas Warten – erzeugt immer zwei Versionen, max 4 Minuten lang. Es git ein kostenloses Plan mit Anmeldung und verschieden Bezahlabos.

Udio ist eine weitere sehr beliebte “prompt to song”-KI

Es gibt aber auch

AIVA (Artificial Intelligence Virtual Artist): Spezialisiert auf klassische und orchestrale Kompositionen. Ideal für Soundtracks in Filmen oder Videospielen. – Wobei das Urheberrecht bei den kostenlosen und preiswerten Abo bei AIVA bleibt und erst ab 33 € kommerziell nutzbar (wie bei Youtube) ist.
Und Mubert: Erzeugt endlose, lizenzfreie Musikstreams in Echtzeit, die sich an Genres, Stimmungen oder Aktivitäten anpassen lassen. Auch hier kostet die kommerzielle Nutzung (z.B. Youtube 33$ im Monat)

Bilder

Klassisch ist Bildbearbeitung wie mit Photoshop, das KI-Werkzeuge integriert hat, um fertige Bilder zu überarbeiten.

Fertige Bilder finde ich z.B. bei https://pixabay.com. Das ist schneller und spart Strom. Und auch dort werden immer mehr generierte Bilder hochgeladen.

Tools zum Selbermachen zum Erstellen & Bearbeiten sind Canva, Pixlr und Fotor und relativ nutzerfreundlich.

Bilder erstellen aus einem beschreibenden Text (Prompt-Anweisung) gibt es in einfachen Varianten, aber auch zum Überarbeiten bis hin zum Erstellen von Videos:

Online-KI mit Text-Prompt for free

  • Gemini kann aus einfachen Prompts kostenlos Bilder in guter Qualität erstellen. Super für die schnelle Gebrauchsvisualisierung.
  • Leonardo AI kostenlos anmelden zum Beispiel mit GoogleKonto, täglich 150 Credits für Bilder. Der Prompt zeigt die Creditkosten an. (Arbeitet im Abo mit Veo 3 Videoerstellung zusammen.)
  • DeepAI kostenloser Online-KI-Bildgenerator, der sofort und ohne Anmeldung genutzt werden kann.
  • OpenArt (Free Plan)
    Bietet einen kostenlosen Plan ohne Kreditkarte, der bis zu 4 parallele Generierungen und tägliche Gratis-Credits für Basismodelle, braucht anmeldung z.B. Google-Konto oder Mail
  • Stable Diffusion Open Source kostenlos anmelden zum Beispiel mit GoogleKonto, erfordert etwas Experimentierfreude, um die besten Ergebnisse zu erzielen. Der Prompt zeigt die Creditkosten an. (Auch via DreamStudio zugänglich.)
  • Microsoft Designer (mit DALL-E):
    Nur mit Microsoft-Konto, aber kostenlos nutzbar, liefert hochwertige, hochauflösende Bilder und manchmal Quatsch.
  • Adobe Firefly
    benutzerfreundliche Oberfläche und ist gut in das Adobe-Ökosystem integriert. Du kannst Text in Bilder umwandeln und Referenzfotos hochladen, um einen Stil zu inspirieren. Es gibt eine kostenlose Version mit begrenzten Credits. Aber keine konsistenten Bilder mit einem Protagonisten in verschiedenen Situationen.

Online-KI mit Text-Prompt im € Abo

  • Midjourney (auch Video) ist für hochwertige konsistente Bilder (Charaktere in unterschiedlichen Situationen) geeignet und sehr bekannt. Basisplan ab 8$ pro Monat Standard 24$ bei jährlicher Abrechnung.
  • ChatGPT Plus (mit DALL-E 3)
    DALL-E 3 ist bekannt für seine Fähigkeit, Prompts sehr gut zu verstehen und detaillierte Bilder zu erzeugen, die den Beschreibungen genau entsprechen. Ab ca. 20 $ pro Monat für ChatGPT Plus.
  • Eine kostenpflichtige Plattform ist Freepik, die mit Flux zur Bilderzeugung arbeitet und auch Video kann.
  • Flux Kontext bietet verschiedene Tools und erstellt auch Videos

Video

Klassisch selbst gemacht und bearbeitet: Die Bezahlversion z.B. von Davinci Resolve Studio (einmal 305 €) bringt einige Tools mit, um eure Videos KI-gestützt bearbeiten zu können.

Eigene Videos zu generieren, z.B. mit einem Promt oder aus einem Ausgangsbild ist anders aufwendig. Dafür brauchst du Bezahl-Abos, die unterschiedlich viele Credits pro Tag oder Monat enthalten. (Ich gebe hier u.a. Tipps weiter vom Youtube-Kanal: Prompt.Try.Repiet)

Klassiker sind sora, kling und runway, aber so richtig gefeiert wird derzeit

VEO 3 von Google kann Videos mit Ton bzw Sprache, was nicht selbstverständlich ist.
Über Gemini Pro (VEO 2) oder VEO 3 (ab ! 37,5 Dollar Monat)

Alternativen sind Hailuo ($10 Monat) / Kling ($80 Jahr) / Midjourney ($10 Monat), die aber derzeit alle noch keinen Ton oder Lippensynchronisation beherrschen.

Weavy.ai ist eine AI-gesteuerte Plattform aus den USA mit knotenbasierter Architektur (notes) für kreative Design-Workflows. Sie integriert verschiedene AI-Modelle für Sprache, Bilder, Videos und 3D-Generierung mit Bearbeitungstools.
Für Bilder z.B. GPT, Bria und Flux Pro und
für Videos kann man z.B. sowohl Veo 3, Kling und Hunyuan Video nutzen.
Es gibt einen MiniPlan für free, der Starter-Plan bietet für 19 Dollar. Dafür gibt es 1.200 monatliche Credits= 3.000 Bilder oder 200 Sekunden Video.

Next level

Bislang habe ich nur einzelne Werkzeuge angesprochen im Bereich Sprache und Texte, Audio, Bilder und Video und die Verknüpfung zu Agents.

Was uns bevorsteht ist aber eine Veränderung unseres Nutzerverhaltens hin zu persönlichen KI-Assistenten = AI Companions (auch KI-Begleiter oder virtuelle Begleiter genannt), die nicht nur einzelne Suchaufgaben erledigen (Google) Wissen zur Verfügung stellen (Wikipedia), Aufgaben ausführen (wie Alexa), Themen recherchieren und Inhalte erstellen (LLMs) und Workflows abarbeiten (AI-Agents).

Wir selbst werden Plattformen, die ausgestattet sind mit Gedächtnis und psychologisch trainierten, individualisierten Dialogmustern als persönliche Begleiter empfinden und zu ihnen Bindungen aufbauen.

Die Frage ist: Welchen Firmen, in welchen Staatsformen, mit welchen Interessen gehören dann diese Plattformen und wem willst du vertrauen? 

Wir schrieben früher Tagebuch oder Dr. Sommer, lasen Horoskope oder machten einen Brigitte-Test >> heute konsumieren immer mehr TikTok oder Instagram >> unsere Kinder werden sich mit ihrem AI Companion unterhalten und interagieren, lernen und sich coachen lassen, medizinisch und psychologisch beraten, Fitnessprogramme abarbeiten und als Assistenten im Beruf nutzen.

Vielleicht werden sie durch uns aber auch den Wert empfinden von Strukturen wie Kirche, in denen sich beseelte Menschen begegnen. Wenn wir menschlichen Umgang pflegen, kann KI ein Werkzeug bleiben und uns Menschen dienen.

"Ich versuche KI zu verstehen und einzusetzen, damit ich den Umgang lerne. Denn ich will KI nutzen können, statt ausgeliefert benutzt zu werden."
Fred Niemeyer, Sommer 2025

KI alltagstauglich und praktisch nutzen

KI ist Teil der Welt geworden, aber ich will weder ihre weltverändenden Fähigkeiten überhöhen, noch Angst schüren. Und für einfache Suchanfragen bauche ich keine KI-Kenntnisse. Ich will anschaulich machen, wie normale Menschen die konkreten Möglichkeiten von KI sinnvoll nutzen können, ohne ein technischer Nerd zu sein.
Wie finden du und ich als Anfänger oder fortgeschrittene NutzerInnen einen Zugang und Umgang mit der KI von heute?

Dazu brauchst du:

  1. Das Wissen um Tools
  2. Musst einschätzen, welche KI was gut kann und wo ihre Grenzen sind, und
  3. solltest eine für die KI lösbare und verständliche Aufgabe formulieren können.
  4. Du solltest immer wieder Gedanken zum Datenschutz beachten und must
  5. auch das Arbeitsergebnis der KI anhand einiger Kriterien einschätzen und prüfen.

Mit anderen Worten: Ich muss mir klar machen,

I. was ich will = mein Ziel definieren und es
II. in zielorientierte Schritte teilen, die sinnvoll aufeinander aufbauen und
III. als Prompt formulieren, wobei du achtsam mit den Informationen umgehst bei der Eingabe und Ausgabe.
(Und auch dabei kann dir ein LLM Chatbot helfen, eine Idee >> in ein Ziel und >> in eine Promptanweisung zu übersetzen 🙂

Menschliche Intelligenz hilft sehr, um künstliche Intelligenz nutzen zu können.

Ich werde nach und nach einige Beispiele vorstellen und durcharbeiten …

Ideenliste für LLM-Aufgaben

Eine erste Aufgabe könnte sein, mit KI eine sogenannte Landingpage zu erstellen, über die sich Interessierte in einen Newsletter eintragen können, um dann Beispiele für KI-Unterstützung mit Ideen, praktischer Umsetzung und Tipps von mir zugesandt zu bekommen. Entweder
a. ganz allgemein,
b. für Kirche und Gemeinde oder
c. für SocialMedia

Könnte dir das helfen?

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.