株式会社DubGuildからの求人

(Full VISA Support, Permanent Residency Support)Development and deployment of speech language foundation models

要求ランク: C / -

職務内容

DubGuild is developing the "World’s Best AI Dubbing Technology" with the goal of enabling content from anywhere to be delivered across the globe without losing its original appeal.
Our products provide AI dubbing technologies that capture the full expressive range required by voice actors and translators, as well as user-friendly interfaces for applying them.

Why are we developing speech language foundation models?
Large language models (LLMs) have attracted significant attention in recent years for their text-based conversational capabilities, and have greatly improved human productivity. However, since much of human communication is inherently conducted through speech, there is a growing need to move toward speech-based models.

The most straightforward way to achieve this is to use a pipeline consisting of automatic speech recognition (ASR) + LLM + text-to-speech (TTS). However, this approach has limitations in emotional expression and real-time responsiveness, which have become barriers to realizing and widely deploying natural voice interactions.

This is why we are developing speech language foundation models: models that can understand, reason with, and generate speech directly, without treating speech merely as an input/output interface for text. This is a technologically challenging field that is still in its early stages globally. DubGuild is taking on this challenge from Japan, aiming to build a world-class speech AI foundation model.

For more details, please refer to our tech blog:
https://blog.dubguild.com/melte/llm-tts-scaling/

After joining, you will primarily belong to one of the following four teams. We also welcome cross-functional contributions across teams.

(A) HPC: Accelerating preprocessing of speech and language data, and executing large-scale pretraining
(B) Storage / Network: Stabilizing communication for large-scale datasets and building data infrastructure
(C) Model Serving / API Infrastructure: Building inference infrastructure and improving stability and responsiveness
(D) ML / NLP / Speech: Preprocessing, tokenization, SFT, RL, and model evaluation using domain expertise

If you work with full time job, we can fully support your VISA. We have some experience of it.

採用の流れ

応募→チャット欄で議論→面接→採択

応募するためには、まずログインしてください

求人詳細

給与時給 4000円 〜
待遇契約社員(3 months ~)
開発環境 Go Python3 React Linux Web開発(サーバーサイド) Web開発(フロントエンド) 研究開発 日本語
応募要件
必須要件
なし
歓迎要件
(A) HPC:

Experience using supercomputers
A tendency to care about actual execution efficiency when running GPU-based workloads
When training machine learning models, you naturally think about which parts of the process may become bottlenecks

(B) Network Infrastructure:

You have more than 10 TB of storage at home
Interest in security technologies
Experience building or managing servers in a lab, company, or at home

(C) Model Serving / API Infrastructure:

Interest in accelerating inference
Experience building or managing servers in a lab, company, or at home

(D) Machine Learning Model Development:

Experience studying machine learning independently outside university or research lab coursework
Practical experience implementing machine learning, such as Kaggle or internships
Interest in machine learning and speech/language processing
勤務時間および休憩時間
recommended in 9:00~18:00
but, anything is OK
手当
storage server
勤務地
東京都 Bunkyo hongo
勤務地へのアクセス
walk 3 min from hongo-sanchome station
休日・休暇
Monday and Saturday
holidays
保険
健康保険
厚生年金保険
労働保険
雇用保険
受動喫煙防止措置
喫煙可能区域での業務なし
その他
We do not require competitive programming skills themselves for the role. However, we highly value the strengths often developed through competitive programming, such as the ability to move quickly, strong implementation skills, and the ability to break down and solve problems.

We also provide an environment where you can further deepen your interest in computer science and mathematics, developed through competitive programming, by applying it to real-world engineering work.

As for the computing environment, several hundred H200/H100/A100 GPUs are available as needed.

応募するためには、まずログインしてください

企業情報

企業名株式会社DubGuild
事業概要
「世界で最も優れたAI吹き替え技術」の開発
DubGuildは「世界で最も優れたAI吹き替え技術」を開発し、あらゆるコンテンツが世界中へ届けられる未来を切り拓くことを目指しています。弊社の製品では、原作の魅力を引き出しながら、吹き替え先言語の話者が求める幅広い表現を生み出すためのAI吹き替え技術や、それを活用するインターフェースを提供しています。
企業の特徴
社内エンジニアの特徴
研究者出身の方が多いです。また、CS専攻の方が多く、サーバーなどは自作しています。
本店所在地東京都 文京区向丘2丁目3-10東大前HiRAKUGATE
代表者大嶽匡俊
設立日2024年10月
従業員数7名
平均年齢26歳
全 4 件 詳細に検索

株式会社DubGuild

設立日2024年10月
社員数7名
平均年齢26歳
Webサイト

DubGuild is developing the "World’s Best AI Dubbing Technology" with the goal of enabling content from anywhere to be delivered across the globe without losing its original appeal. Our products provide AI dubbing technologies that capture the full expressive range required by voice actors and translators, as well as user-friendly interfaces for applying them. Why are we developing speech lang... [詳細]

給与時給 4000円〜
勤務地東京都 Bunkyo hongo
アクセス
walk 3 min from hongo-sanchome station
待遇契約社員(3 months ~)
開発環境Go Python3 React Linux Web開発(サーバーサイド) Web開発(フロントエンド) 研究開発 日本語
必須要件なし

詳細を見る

株式会社DubGuild

設立日2024年10月
社員数7名
平均年齢26歳
Webサイト

DubGuildは「世界で最も優れた音声言語基盤モデルの構築」を目標に研究開発を進めています。 何故音声言語基盤モデルを開発するのか: 大規模言語モデル(LLM)は近年、テキストベースの対話能力によって大きな注目を集め、我々の生産性を大きく改善しました。一方で、人間の主要なコミュニケーションでは音声で行われているため、音声ベースのモデルへの移行が求められています。これを実現する最も素朴な方法は、「音声認識(... [詳細]

給与年収 700万円〜1300万円
勤務地東京都 文京区本郷
アクセス
本郷三丁目駅から徒歩4分
待遇正社員
開発環境Go Python3 TypeScript React Web開発(サーバーサイド) Web開発(フロントエンド) 研究開発 日本語
必須要件週に1日程度オフィスへ出社勤務可能な方

詳細を見る

株式会社DubGuild

設立日2024年10月
社員数7名
平均年齢26歳
Webサイト

DubGuildは「世界で最も優れた音声言語基盤モデルの構築」を目標に研究開発を進めています。 何故音声言語基盤モデルを開発するのか: 大規模言語モデル(LLM)は近年、テキストベースの対話能力によって大きな注目を集め、我々の生産性を大きく改善しました。一方で、人間の主要なコミュニケーションでは音声で行われているため、音声ベースのモデルへの移行が求められています。これを実現する最も素朴な方法は、「音声認識(... [詳細]

給与時給 2000円〜4000円
勤務地東京都 文京区本郷
アクセス
本郷三丁目駅から徒歩4分
待遇アルバイト(契約期間については柔軟に対応可能です)
開発環境Go HTML/CSS Python3 React Linux Mac OS Windows Amazon Web Service Vim Web開発(サーバーサイド) Web開発(フロントエンド) 研究開発 デスクトップアプリ開発 日本語
必須要件週に1日程度オフィスへ出社勤務可能な方 (能力にもよりますが、大規模な計算資源を触る場合、週20時間以上のコミットが必要と考えています。)

詳細を見る

株式会社DubGuild

設立日2024年10月
社員数7名
平均年齢26歳
Webサイト

DubGuildは「世界で最も優れた音声言語基盤モデルの構築」を目標に研究開発を進めています。 何故音声言語基盤モデルを開発するのか: 大規模言語モデル(LLM)は近年、テキストベースの対話能力によって大きな注目を集め、我々の生産性を大きく改善しました。一方で、人間の主要なコミュニケーションでは音声で行われているため、音声ベースのモデルへの移行が求められています。これを実現する最も素朴な方法は、「音声認識(... [詳細]

給与時給 3000円〜
勤務地東京都 文京区本郷
アクセス
本郷三丁目駅から徒歩4分
待遇業務委託/フリーランス(3か月~)
開発環境Go Python3 TypeScript React Web開発(サーバーサイド) Web開発(フロントエンド) 研究開発 日本語
必須要件週2日以上、勤務できる方(週15時間以上) 週に1日程度オフィスへ出社勤務可能な方

詳細を見る