مدل متن‌باز DeepSeek R1 منتشر شد

سه شنبه 02 بهمن 1403

نویسنده : آزاد کبیری

مدل متن‌باز DeepSeek R1 منتشر شد — عکس : مدل متن‌باز DeepSeek R1

استارتاپ هوش مصنوعی چینی DeepSeek به‌تازگی DeepSeek-R1 را منتشر کرده است که مدلی متن‌باز و استدلال‌گر محسوب می‌شود. به ادعای این استارتاپ، این مدل در برخی بنچمارک‌ها مدل o1 از شرکت OpenAI را شکست می‌دهد. نکته قابل‌توجه این است که هزینه‌های مدل چینی‌ تا 95 درصد کمتر از مدل آمریکایی است.

به گزارش سرویس اخبار هوش مصنوعی سایت شات ایکس و به نقل از دیجیاتو دیپ‌سیک ضمن انتشار مدل DeepSeek-R1 در Hugging Face، در گزارشی عملکرد این مدل استدلال‌گر را در بنچمارک‌های مختلف نشان داده است. مدل R1 توانسته در بنچمارک‌های AIME ،MATH-500 و SWE-bench Verified مدل o1 را شکست دهد. این مدل در تست‌های ریاضی AIME امتیاز 79.8 درصد و در MATH-500 امتیاز 97.3 درصد را کسب کرد. همچنین امتیاز 2 هزار و 29 را در تست Codeforces به دست آورد؛ بهتر از 96.3 درصد برنامه‌نویسان انسانی عمل کرده است. در مقابل، مدل o1 به‌ترتیب امتیازهای 79.2 درصد، 96.4 درصد و 96.6 درصد را در این بنچمارک‌ها به دست آورده بود.

البته این مدل در بنچمارک MMLU که مربوط به دانش عمومی است، امتیاز 90.8 درصد را کسب کرد که کمی کمتر از امتیاز 91.8 درصد o1 است. درکل، امتیازهای این 2 مدل خیلی به یکدیگر نزدیک است، با این تفاوت که مدل استارتاپ چینی با هزینه‌ای 90 تا 95 درصد کمتر از مدل o1 این محاسبات را انجام می‌دهد.

مدل‌های استدلال‌گر در مقایسه با مدل‌های عادی کُندتر هستند و معمولاً چند ثانیه تا چند دقیقه طول می‌کشد تا پاسخ‌ بدهند اما مزیتشان این است که در حوزه‌هایی مانند فیزیک، علوم و ریاضیات قابل‌اعتمادترند. DeepSeek در گزارش اخیرش گفته R1 حاوی 671 میلیارد پارامتر است و بر پایه مدل DeepSeek V3 توسعه یافته؛ مدل‌هایی با پارامترهای بیشتر معمولاً بهتر از مدل‌هایی با پارامترهای کمتر عمل می‌کنند.

عکس : مقایسه عملکرد مدل‌های DeepSeek با مدل‌های o1

البته DeepSeek نسخه‌های کوچک‌تر R1 را در اندازه‌های یک‌میلیارد پارامتر تا 70 میلیارد پارامتر نیز منتشر کرده که کوچک‌ترین مدل می‌تواند روی لپ‌تاپ‌ها اجرا شود اما برای اجرای نسخه کامل R1 به سیستم قوی‌تری نیاز دارید؛ البته اگر بین استفاده از این مدل و مدل OpenAI مردد هستید، بهتر است نگاهی به هزینه‌های این 2 بیندازید.

مدل o1 تقریباً 15 دلار به‌ازای هر میلیون توکن ورودی و 60 دلار به‌ازای هر میلیون توکن خروجی هزینه دارد اما هزینه مدل R1 فقط 0.55 دلار به‌ازای هر میلیون توکن ورودی و 2.19 دلار به‌ازای هر میلیون توکن خروجی است.

البته می‌توانید از قابلیت‌های مدل‌های استدلال‌گر این شرکت در اپلیکیشن و نسخه وب دیپ‌سیک رایگان استفاده کنید. برای استفاده از مدل استدلال‌گر آن کافی است گزینه DeepThink را فعال و درخواست خود را بیان کنید.