Hubathon #1 Paris — Multimodal Data Pipeline Hackathon (Hiring Edition)
Concevez un pipeline IA de bout en bout qui transforme des vidéos ou audios bruts en sorties propres, structurées et sémantiquement riches.
Date and time
Location
Paris
Secret 75000 Paris FranceGood to know
Highlights
- 12 hours
- ALL AGES
- In person
- Doors at 8:00 AM
About this event
Concevez un pipeline IA de bout en bout qui transforme des vidéos ou audios bruts en sorties propres, structurées et sémantiquement riches (recherche, résumé, analytics). Cet événement est aussi un processus de recrutement : vos performances influencent directement une opportunité de poste en Data Science / ML Engineering chez Hub.xyz.
Inscrivez-vous à notre evenement sur ce lien: https://luma.com/jyvgisdw
👥 Format & capacité
- Équipes : 2-3 personnes
- Capacité : 20 places (sur sélection)
- Durée : 1 jour
💰 Prix & recrutement
- Récompense : 2 000 € (cash prize)
- Emploi : 1 ou plusieurs participant·e sera retenu·e pour une fast-track d’embauche chez Hub.xyz (entretiens et vérifications standards).
🧩 Le challenge (choisir une piste)
Piste 1 — Annotation descriptive vidéo
Produire des descriptions en langage naturel par scène (contexte visuel, objets, actions, interactions). Pas de bounding boxes/segmentation : on évalue la qualité sémantique.
Piste 2 — Transcription audio multi-locuteurs
Générer des transcriptions horodatées et attribuées par locuteur (diarisation). (Optionnel : pistes nettoyées par locuteur.)
Nous fournissons : un pack de données (vidéo/audio), un schéma JSON attendu et des utilitaires (ffmpeg, validateurs).
Livrables (GitHub) : code exécutable, échantillons de sortie (/results), démo vidéo 2–4 min (/demo), rapport technique, README.md clair.
Évaluation (aperçu) : complétude du pipeline, qualité des sorties, qualité du code, pertinence outils/modèles, clarté de la démo/rapport, signaux de scalabilité & hygiène du repo. Bonus pour couche QA/validation et interface de recherche.
✅ Candidature (sur sélection)
Date limite : 12 septembre, 23:59 CEST (Paris)
Vous recevrez un e-mail d’acceptation avec les infos de check-in.
Nous recherchons des participant·e·s capables de concevoir des modèles et des pipelines de données et de réfléchir de façon créative sous pression.
Capacité limitée : nous accepterons environ 20 participant·e·s (≈ 7-10 équipes). Compte tenu de l’intérêt attendu (100+ candidatures), la sélection se fera sur la base de vos réponses. Nous évaluerons votre expérience et vos compétences, ainsi que la créativité et la qualité du raisonnement démontrées dans la question technique courte.
👉 Merci de remplir le formulaire avec soin afin de montrer ce qui fait de vous un·e excellent·e candidat·e pour ce challenge !
🧰 Infos pratiques
- Lieu : Île-de-France (adresse exacte communiquée après acceptation)
- Langue : EN (FR bienvenue)
- À apporter : laptop, chargeur, adaptateurs, éventuelles clés API
- Stack conseillée : Python (OpenCV/ffmpeg/torchaudio, Hugging Face, scikit-learn, PyTorch/TF). GPU bienvenus si disponibles ; visez l’efficience.
- Éthique & IP : vous conservez la propriété de votre code. Sources publiques et conformes uniquement (pas d’accès derrière login/ToS). Respect de la vie privée et de la sécurité.
🏢 À propos de Hub.xyz
Hub construit la première super-infrastructure de bande passante programmable : un réseau décentralisé qui transforme la bande passante inutilisée en flux de données multimodales en temps réel pour les systèmes d’IA et les entreprises. Communauté massive, vitesse d’exécution, ambition produit : le pipeline de données imparable de l’économie des machines.
🔗 Liens Officiels
- Site Web: https://hub.xyz/
- Twitter: https://x.com/hubdotxyz
- Discord: https://discord.gg/hub-xyz
- LinkedIn: https://www.linkedin.com/company/hub-xyz/
- Blog Medium: https://medium.hub.xyz/
📬 Contact
Questions : daniel@hub.xyz (objet : Hubathons Paris)
English VersionDesign an end-to-end AI pipeline that transforms raw video or audio into clean, structured, and semantically rich outputs (search, summary, analytics). This event is also a recruitment process: your performance will directly influence your chances of securing a position in Data Science/ML Engineering at Hub.xyz.
Sign up to our event using this link: https://luma.com/jyvgisdw
👥 Format & capacity
- Teams: 2-3 people
- Capacity: 20 seats (by selection)
- Duration: 1 day
💰 Reward & recruitment
- Reward: 2 000 € (cash prize)
- Employment: One or more participants will be selected for fast-track hiring at Hub.xyz (standard interviews and background checks).
🧩The challenge (choose a track)
Track 1 — Descriptive video annotation
Produce natural language descriptions per scene (visual context, objects, actions, interactions). No bounding boxes/segmentation: semantic quality is evaluated.
Track 2 — Multi-speaker audio transcription
Generate timestamped transcripts attributed to each speaker (diarization). (Optional: tracks cleaned up by speaker.)
We provide: a data pack (video/audio), an expected JSON schema, and utilities (ffmpeg, validators).
Deliverables (GitHub): executable code, output samples (/results), 2–4 min video demo (/demo), technical report, clear README.md.
Evaluation (overview): completeness of the pipeline, quality of outputs, code quality, relevance of tools/models, clarity of demo/report, scalability signals & repository hygiene. Bonus points for QA/validation layer and search interface.
✅ Application (on selection)
Deadline: September 12, 11:59 p.m. CEST (Paris)
You will receive an acceptance email with check-in information.
We are looking for participants who are capable of designing models and data pipelines and thinking creatively under pressure.
Limited capacity: we will accept approximately 20 participants (≈ 7-10 teams). Given the expected interest (100+ applications), selection will be based on your responses. We will evaluate your experience and skills, as well as the creativity and quality of reasoning demonstrated in the short technical question.
👉 Please fill out the form carefully to show what makes you an excellent candidate for this challenge!
🧰 Practical information
- Lieu : Île-de-France (exact address provided upon acceptance)
- Language: EN (FR welcomed)
- Please bring: laptop, charger, adapters, API keys if applicable
- Recommended stack: Python (OpenCV / ffmpeg / torchaudio, Hugging Face, scikit-learn, PyTorch/TF). GPUs welcome if available; aim for efficiency.
- Ethics & IP: you retain ownership of your code. Only public and compliant sources (no access behind login/ToS). Respect for privacy and security.
🏢 About Hub.xyz
Hub is building the first programmable bandwidth super-network: a decentralized network that transforms unused bandwidth into real-time multimodal data streams for AI systems and businesses. Massive community, speed of execution, product ambition: the unstoppable data pipeline of the machine economy.
🔗 Official Links
- Website: https://hub.xyz/
- Twitter: https://x.com/hubdotxyz
- Discord: https://discord.gg/hub-xyz
- LinkedIn: https://www.linkedin.com/company/hub-xyz/
- Blog Medium: https://medium.hub.xyz/
📬 Contact
Questions : daniel@hub.xyz (object : Hubathons Paris)
Frequently asked questions
You can apply for a place at the event using this link: https://luma.com/jyvgisdw
Only 20 members will be accepted, use this link to access the registration form, you will be notified by email ahead of the event if you are selected: https://luma.com/jyvgisdw
Organized by
Followers
--
Events
--
Hosting
--