Ich habe eine Skill für Claude Code geschrieben, einfach einen Link reinwerfen — unterstützt Small Universe, YouTube, Bilibili, sowohl Chinesisch als auch Englisch. Drei KI-Modelle arbeiten jeweils eigenständig: • Claude ist für die Steuerung des gesamten Prozesses verantwortlich • Whisper wandelt Audio in Text um • Gemini verarbeitet lange Texte mit 50.000 Wörtern und gibt eine strukturierte Zusammenfassung aus Das Interessanteste ist, dass die Audio-Quellen der drei Plattformen völlig unterschiedlich sind. Small Universe ist am einfachsten, die Audio-Links sind direkt im Seitenquelltext versteckt. YouTube hat Anti-Crawling-Mechanismen, da muss man einen Umweg nehmen. Bilibili ist am aufwendigsten — die üblichen Methoden sind alle blockiert, letztlich greift man direkt auf ihre unterliegende API zu, um die Audios zu bekommen. In Tests haben wir drei Videos (siehe Bild) erfolgreich durchlaufen: 117min + 181min + 114min. Das längste, 181 Minuten, wurde mit über 50.000 Wörtern transkribiert. Früher konnte man bei 3-Stunden-Podcasts nur zuhören oder nicht, jetzt gibt es eine dritte Option: zuerst die Highlights ansehen, und wenn es sich lohnt, die Originalaufnahme noch einmal anhören.
Original anzeigen
Diese Seite kann Inhalte Dritter enthalten, die ausschließlich zu Informationszwecken bereitgestellt werden (keine Zusicherungen oder Garantien), und sie sind nicht als Billigung der darin geäußerten Ansichten durch Gate oder als finanzielle bzw. fachliche Beratung zu verstehen. Weitere Informationen finden Sie im Haftungsausschluss.
3 Stunden Podcast/Video, 15 Minuten Highlights.
Ich habe eine Skill für Claude Code geschrieben, einfach einen Link reinwerfen — unterstützt Small Universe, YouTube, Bilibili, sowohl Chinesisch als auch Englisch.
Drei KI-Modelle arbeiten jeweils eigenständig:
• Claude ist für die Steuerung des gesamten Prozesses verantwortlich
• Whisper wandelt Audio in Text um
• Gemini verarbeitet lange Texte mit 50.000 Wörtern und gibt eine strukturierte Zusammenfassung aus
Das Interessanteste ist, dass die Audio-Quellen der drei Plattformen völlig unterschiedlich sind. Small Universe ist am einfachsten, die Audio-Links sind direkt im Seitenquelltext versteckt. YouTube hat Anti-Crawling-Mechanismen, da muss man einen Umweg nehmen. Bilibili ist am aufwendigsten — die üblichen Methoden sind alle blockiert, letztlich greift man direkt auf ihre unterliegende API zu, um die Audios zu bekommen.
In Tests haben wir drei Videos (siehe Bild) erfolgreich durchlaufen: 117min + 181min + 114min. Das längste, 181 Minuten, wurde mit über 50.000 Wörtern transkribiert.
Früher konnte man bei 3-Stunden-Podcasts nur zuhören oder nicht, jetzt gibt es eine dritte Option: zuerst die Highlights ansehen, und wenn es sich lohnt, die Originalaufnahme noch einmal anhören.