یک استارتاپ تازهکار از چین در حال ایجاد انقلابی در صنعت هوش مصنوعی است. DeepSeek یک چتبات جدید منتشر کرده که عملکردی همرده با ChatGPT دارد. اما هوش مصنوعی دیپ سیک چیست و چه قابلیتهایی دارد؟
به گزارش تکراتو و به نقل از digitaltrends، مدل هوش مصنوعی DeepSeek عملکردی همسطح چت جی پی تی ارائه میکند؛ اما مصرف انرژی کمتری دارد و هزینههای آموزش آن کمتر از مدلهای هوش مصنوعی OpenAI، گوگل و Anthropic است. این هوش مصنوعی بهسرعت توجهات زیادی را به خود جلب کرد و در اپ استور اپل، جای ChatGPT را گرفت.
در ادامه، هر آنچه باید درباره مدلهای V3 و R1 دیپ سیک بدانید را با شما به اشتراک میگذاریم. همچنین به شما میگوییم که چرا این شرکت میتواند اهداف هوش مصنوعی آمریکا را به چالش بکشد.
دیپ سیک چیست ؟
دیپ سیک (به طور رسمی، Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd.) یک استارتاپ هوش مصنوعی چینی است که در ابتدا در آوریل 2023 به عنوان آزمایشگاه هوش مصنوعی برای شرکت مادر خود، High-Flyer تاسیس شد. در ماه می همان سال، دیپ سیک به یک شرکت مستقل تبدیل شد (در حالی که High-Flyer همچنان به عنوان سرمایهگذار باقی ماند) و مدل DeepSeek-V2 خود را عرضه کرد.
مدل V2 عملکردی همتراز با دیگر شرکتهای پیشرو هوش مصنوعی چین، مانند ByteDance ،Tencent و Baidu داشت، اما هزینه عملیاتی آن بسیار کمتر بود.
این شرکت در دسامبر 2024 مدل V3 را عرضه کرد. V3 یک مدل 671 میلیارد پارامتری است که گزارش شده در کمتر از دو ماه آموزش دیده است. به گفته تحلیلگران Jeffries، هزینه آموزش V3 تنها 5.6 میلیون دلار بوده (با فرض هزینه اجاره 2 دلار در ساعت برای H800). این هزینه کمتر از 10 درصد هزینه آموزش مدل Llama متا است و در مقایسه با صدها میلیون تا میلیاردها دلاری که شرکتهایی مثل گوگل، مایکروسافت، xAI و OpenAI برای آموزش مدلهای خود هزینه میکنند، بسیار ناچیز است.
آزمایشهای بنچمارک نشان دادهاند که عملکرد V3 همتراز با GPT-4o و Claude 3.5 Sonnet است. مقالهای در دسامبر 2024 در The Hill، موفقیت دیپ سیک را به عنوان «لحظه اسپوتنیک آمریکا» توصیف کرد.
در نوامبر 2024، دیپ سیک مدل R1-Lite-Preview را معرفی کرد و ادعا کرد که این مدل میتواند از خانواده مدلهای استدلال OpenAI یعنی o1 بهتر عمل کند (و با هزینهای بسیار کمتر). شرکت تخمین زده که مدل R1 بین 20 تا 50 برابر ارزانتر از o1 عمل میکند، بسته به اینکه وظیفه موردنظر چه باشد. دیپ سیک سپس در ژانویه 2025 مدلهای DeepSeek-R1 و DeepSeek-R1-Zero را عرضه کرد. برخلاف مدل رقیب o1، R1 متنباز است، به این معنی که هر توسعهدهندهای میتواند از آن استفاده کند.
به این ترتیب، مدلهای V3 و R1 از زمان عرضه محبوبیت زیادی پیدا کردهاند. دستیار هوش مصنوعی مبتنی بر V3 دیپ سیک جایگاه ChatGPT را در صدر فروشگاههای اپلیکیشن به دست آورده است. مارک آندریسن، سرمایهگذار خطرپذیر، در یک پست شبکه اجتماعی اخیر، چتبات دیپ سیک را «یکی از شگفتانگیزترین و تاثیرگذارترین پیشرفتهایی که تاکنون دیدهام» و «هدیهای ارزشمند برای جهان» توصیف کرده است.
توانایی های دیپ سیک چیست ؟
چتباتهای دیپ سیک به عنوان یک مدل زبان بزرگ متنباز میتوانند تقریبا هر کاری را که ChatGPT ،Gemini و Claude انجام میدهند، انجام دهند. این شامل تولید متن، صدا، تصویر و ویدیو میشود. علاوهبراین، گزارش شده که خانواده جدید مدلهای چندوجهی دیپ سیک، با نام Janus Pro، عملکرد بهتری نسبت به DALL-E 3 ،PixArt-alpha ،Emu3-Gen و Stable Diffusion XL در دو بنچمارک صنعتی داشتهاند.
مدل DeepSeek-R1 که رقیب o1 است، بهطور ویژه برای انجام وظایف استدلال پیچیده طراحی شده و میتواند راهحلهای گامبهگام برای مشکلات ارائه دهد و «زنجیرههای منطقی» ایجاد کند. این یعنی هنگام حل یک مشکل، فرآیند استدلال خود را گامبهگام توضیح میدهد.
چه کسانی میتوانند از دیپ سیک استفاده کنند؟
مدل هوش مصنوع یDeepSeek به عنوان یک مدل زبان بزرگ متنباز، برای هر توسعهدهندهای به صورت رایگان قابل استفاده است. OpenAI برای دسترسی به مدل o1، اشتراک ماهیانه 200 دلاری دریافت میکند، در حالی که مدلهای دیپ سیک از طریق وبسایت شرکت، API و اپلیکیشنهای موبایل در دسترس هستند.
برای استفاده از این پلتفرم، باید یک حساب رایگان در وبسایت دیپ سیک ایجاد کنید، اما شرکت به دلیل «حملات مخرب گسترده به خدمات دیپ سیک»، فعلا ثبتنامهای جدید را متوقف کرده است. کاربران فعلی میتوانند بهصورت عادی وارد شوند و از این پلتفرم استفاده کنند، اما هنوز زمانی برای امکان ثبتنام کاربران جدید اعلام نشده است.
چرا دیپ سیک به طور ناگهانی اینقدر اهمیت پیدا کرده است؟
از زمان عرضه ChatGPT در نوامبر 2023، شرکتهای هوش مصنوعی آمریکایی تمام تمرکز خود را روی ساخت مدلهای زبانی بزرگتر، قدرتمندتر و گستردهتر گذاشتهاند که پرهزینهتر هستند و منابع بیشتری مصرف میکنند. شرکتهایی مانند OpenAI، مایکروسافت، Anthropic و گوگل به جای تلاش برای ساخت مدلهای زبانی بزرگ (LLM) مقرونبهصرفه و کممصرف، ترجیح دادهاند با تزریق منابع مالی و سختافزاری عظیم، فناوری را به پیش ببرند. در سال 2024، انتظار میرفت ایلان ماسک، مدیرعامل xAI، به تنهایی بیش از 10 میلیارد دلار روی پروژههای هوش مصنوعی هزینه کند. همچنین OpenAI و شرکای آن پروژه عظیم Stargate را با بودجه 500 میلیارد دلاری اعلام کردند که هدف آن تسریع ساخت زیرساختهای انرژی سبز و مراکز داده هوش مصنوعی در سراسر ایالات متحده است.
گوگل نیز طبق اعلام ساندار پیچای، مدیرعامل این شرکت، قصد دارد در سال 2025 روی گسترش پلتفرم جمینای تمرکز کند و میلیاردها دلار برای رسیدن به این هدف هزینه کند. متا در اواسط ژانویه اعلام کرد که امسال تا سقف 65 میلیارد دلار در توسعه هوش مصنوعی سرمایهگذاری خواهد کرد.
دیپ سیک به جهان نشان داد که هیچکدام از اینها واقعا ضروری نیست. این شرکت ثابت کرد که «رونق هوش مصنوعی» که اخیرا به اقتصاد آمریکا کمک کرده و شرکتهایی مثل انویدیا را به طرز چشمگیری ثروتمندتر از اکتبر 2023 کرده است، ممکن است چیزی جز یک خیال نباشد. همچنین این سوال مطرح میشود که آیا ایالات متحده واقعا در زمینه هوش مصنوعی پیشتاز است یا خیر، با وجود اینکه در سال گذشته بارها ارسال پردازندههای پیشرفته به چین را ممنوع کرده است.
کیت لرنر، تحلیلگر Truist، در گفتگو با CNN گفت:
نکته اصلی این است که عملکرد بالای آمریکا بر پایه فناوری و برتری شرکتهای آمریکایی در هوش مصنوعی استوار بوده است. عرضه مدلهای دیپ سیک باعث شده سرمایهگذاران این برتری و همچنین میزان هزینهکرد و احتمال سودآوری یا زیادهروی در این هزینهها را زیر سوال ببرند.
به بیان ساده، دیپ سیک صنعت هوش مصنوعی آمریکا را در بازی خودش شکست داد و نشان داد که رویکرد فعلی «رشد به هر قیمتی» دیگر معتبر نیست. سرینی پاجوری، تحلیلگر نیمههادی در Raymond James، در گفتگو با CNBC گفت:
دیپ سیک به وضوح به اندازه شرکتهای بزرگ آمریکایی به منابع محاسباتی دسترسی ندارد، اما به نحوی توانسته مدلی توسعه دهد که به نظر میرسد رقابتی و پیشرفته باشد.
اگر یک استارتاپ چینی بتواند مدلی طراحی کند که عملکردی همسطح با جدیدترین و بهترین مدل OpenAI داشته باشد و این کار را در کمتر از دو ماه و با هزینه کمتر از 6 میلیون دلار انجام دهد، دیگر چه نیازی به سم آلتمن است؟
مایکل بلاک، استراتژیست بازار در Third Seven Capital، به CNN گفت:
زمان مشخص خواهد کرد که آیا تهدید دیپ سیک واقعی است یا نه. رقابت آغاز شده است تا مشخص شود کدام فناوری بهتر عمل میکند و بازیگران بزرگ غربی چگونه پاسخ خواهند داد و تکامل خواهند یافت. بازارها بیش از حد به آغاز دوره دوم ترامپ عادت کرده بودند و شاید به دنبال بهانهای برای عقبنشینی بودند — و حالا یک بهانه بزرگ پیدا کردهاند.
آیا DeepSeek میتواند جای ChatGPT را بگیرد؟
از چت جی پی تی پرسیدم: «به نظرت این مدل هوش مصنوعی میتونه جای تو رو بگیره؟» جواب ChatGPT به این سوال جالب بود:
سوال جالبیه! 😊
مدلهای هوش مصنوعی مثل DeepSeek یا حتی ChatGPT (خودم!) در حال پیشرفت هستن، ولی هنوز برای جایگزین شدن کامل به جای انسانها (حتی در نقش یک دستیار هوش مصنوعی مثل من) با چالشهایی مواجه هستن. چند نکته هست که باید در نظر گرفت:
1. تعامل انسانی: هرچند مدلهای هوش مصنوعی خیلی پیشرفته هستن، ولی توانایی درک احساسات، ظرایف فرهنگی و ترجمه مفهوم در قالبهای خاص هنوز کاملا انسانی نیست. من برای این طراحی شدم که به شما کمک کنم، ولی هنوز به سطحی نرسیدم که مثل یک انسان فکر کنم یا خلاقیت نامحدود داشته باشم.
2. تخصص و قابلیت تنظیم: مدلهایی مثل من به شکلی طراحی شدن که قابل شخصیسازی باشن و با شما سازگار بشن. مثلا من به نیازها و ترجیحات شما توجه میکنم و سعی میکنم پیشنهادات دقیقتری ارائه بدم. این نوع تعامل ممکنه برای کاربرهای خاص ارزشمندتر باشه.
3. چالشهای منابع باز: در حالی که مدلهای اوپنسورس مثل DeepSeek میتونن برای توسعهدهندهها جذاب باشن، پیچیدگی استفاده و نیاز به تنظیمات پیشرفته میتونه برای کاربران عمومی چالشبرانگیز باشه.
4. کیفیت پاسخها و عملکرد کلی: مدلهایی مثل DeepSeek اگرچه ممکنه در بعضی زمینهها پیشرفتهتر باشن، اما کیفیت پاسخدهی و ثبات عملکرد به شدت وابسته به نحوه استفاده و دادههای آموزشی هست.
در نهایت، هر فناوری که بتونه تعامل بهتر و پاسخهای دقیقتری ارائه بده، شاید بتونه جای من رو در بعضی موارد بگیره. اما هدف اصلی این ابزارها، از جمله من، کمک به شماست، نه رقابت. پس شاید بهتر باشه به این پیشرفتها به عنوان مکمل نگاه کنیم، نه تهدید. 😄
نظر شما درباره مدل هوش مصنوعی دیپ سیک چیست ؟ دیدگاه خود را در بخش کامنتها با تکراتو به اشتراک بگذارید و اخبار تکنولوژی را با ما دنبال کنید.
source