🟢 کمپانی OpenAI از HealthBench برای ارزیابی مدلهای هوش مصنوعی سلامت رونمایی کرد
🔸کمپانی OpenAI بهتازگی از مدل زبانی متنباز جدیدی به نام HealthBench رونمایی کرده که به سازمانهای خدمات بهداشتی امکان میدهد عملکرد مدلهای هوش مصنوعی را ارزیابی کنند.
🔸براساس اطلاعیه OpenAI، مدل HealthBench با همکاری ۲۶۲ پزشک از ۶۰ کشور ساخته شده و شامل ۵ هزار گفتگوی واقعی مرتبط با سلامت است. این کمپانی هدف ساخت HealthBench را ارزیابی عملکرد مدلهای هوش مصنوعی در ارائه بهترین پاسخ به سؤالات بهداشتی کاربران اعلام کرده است.
🔸هر پاسخ مدلهای هوش مصنوعی براساس معیارهایی که پزشکان تعیین کردهاند، ارزیابی میشود و هر معیار براساس قضاوت پزشک وزن خاصی دارد. مدل GPT-4.1 به این معیارها امتیاز میدهد.
🔸براساس ارزیابیهای HealthBench، تاکنون مدل استدلالی o3 از #OpenAI با کسب امتیاز ۶۰ درصد بهترین عملکرد را میان مدلهای موجود در بازار داشته است. پسازآن، مدل #هوش_مصنوعی گراک متعلق به استارتاپ ایلان ماسک با امتیاز ۵۴ درصد و مدل جمینای ۲.۵ پرو با ۵۲ درصد در رتبههای بعدی قرار گرفتهاند.
➖➖➖➖➖
🗳@hoomas
🟢 مدل پرچمدار GPT-4.1 حالا در دسترس کاربران ChatGPT قرار گرفت
🔸مدل هوش مصنوعی GPT-4.1 اواخر ماه گذشته توسط OpenAI بهعنوان یک پرچمدار جدید، قدرتمند و کمهزینه معرفی شد و اکنون در دسترس کاربران اشتراکی ChatGFPT قرار گرفته است.
🔸جدیدترین نسخههای مدلهای #هوش_مصنوعی #OpenAI اکنون در حال عرضه برای ChatGPT هستند. شرکت OpenAI اعلام کرد که مدل GPT-4.1 از این پس برای تمام سطوح اشتراکی ChatGPT قابل دسترس خواهد بود و کاربران از منوی انتخاب مدل میتوانند به آن دسترسی داشته باشند.
🔸کاربران رایگان فعلاً از این نسخه بهرهمند نخواهند شد، اما OpenAI اعلام کرده که کاربران سازمانی (Enterprise) و آموزشی (Edu) طی هفتههای آینده به آن دسترسی خواهند یافت.
🔸همچنین مدل سبکتر و ارزانتر GPT-4o mini که سال گذشته معرفی شده بود، اکنون جای خود را به GPT-4.1 mini داده و بهعنوان گزینه پیشفرض در ChatGPT برای همه کاربران، حتی حسابهای رایگان، در دسترس قرار گرفته است.
➖➖➖➖➖
🗳@hoomas
📱کمپانی OpenAI از ایجنت هوش مصنوعی جدید Codex برای کدنویسی رونمایی کرد
🔸کمپانی #OpenAI از ابزار جدیدی برای کدنویسی با ChatGPT رونمایی کرده که Codex نام دارد و قرار است در نقش «دستیار مجازی» برای مهندسان نرمافزار عمل کند. این ابزار هماکنون در قالب نسخه پیشنمایش تحقیقاتی برای کاربران نسخههای اشتراکی ChatGPT در دسترس قرار گرفته است. استفاده از Codex درحالحاضر هزینه اضافی ندارد اما OpenAI میخواهد در آینده متناسب با استقبال کاربران، برای آن هزینه بگیرد.
🔸ایجنت Codex میتواند به کمک زبان طبیعی کد تولید کند، مستقل خطاها را رفع و کدها را تست کند همچنین پیشنهادهایی برای بهبود عملکرد آنها ارائه دهد. این فرایند ممکن است تا ٣٠ دقیقه طول بکشد. قرار است Codex در آینده بتواند مدت طولانیتری در پسزمینه فعال بماند.
🔸ایجنت Codex فعلاً به نسخه تحت وب ChatGPT اضافه شده اما عمداً به اینترنت متصل نیست تا از بروز مشکلات امنیتی جلوگیری شود. همچنین این ابزار بر پایه نسخهای سفارشی از مدل استدلالگر o3 شرکت OpenAI توسعه داده شده که با نام codex-1 شناخته میشود و مختص کدنویسی است.
➖➖➖➖➖
🗳@hoomas
🟢 شرکت OpenAI ایجنت هوش مصنوعی Operator را به مدل قدرتمند o3 مجهز کرد
🔸شرکت OpenAI نسخه جدید عامل مرورگر وب و کنترلکننده موس خود با نام «Operator» را به مدل قدرتمندتر o3 ارتقا داد.
🔸این نسخه از ۲۳ مه ۲۰۲۵ (اول خرداد) در قالب «پیشنمایش پژوهشی» برای مشترکان طرح ChatGPT Pro با هزینه ۲۰۰ دلار در ماه در دسترس قرار گرفته است.
🔸این ارتقا از مدل GPT-4o به o3، عملکرد، دقت و نرخ موفقیت را افزایش چشمگیری داده و باعث شده اشتراک پرو در مقایسه با بستههای رقیب مانند سرویس ۲۵۰ دلاری گوگل جذابتر به نظر برسد.
🔸نسخه Operator که نخستین بار ژانویه ۲۰۲۵ معرفی شد، نمایانگر ورود #OpenAI به حوزه عاملهای نیمهخودکار بود. این ایجنت مستقل در مرورگر مجازی مبتنیبر فضای ابری از طریق سایت operator.chatgpt.com فعالیت میکند و میتواند وظایفی مانند رزرو رستوران، تنظیم لیست خرید یا سفارش بلیت را انجام دهد و کاربران اجرای زنده این اقدامات را درلحظه مشاهده میکنند.
🔸در آزمون OSWorld امتیاز مدل جدید ۴۲.۹ و مدل قبلی ۳۸.۱ بوده، و در WebArena نیز از ۴۸.۱ به ۶۲.۹ افزایش یافته است. بیشترین بهبود در آزمون GAIA دیده میشود که مدل o3 امتیاز ۶۲.۲ را کسب کرده ولی نسخه قبلی فقط ۱۲.۳ امتیاز داشته است.
➖➖➖➖➖
🗳@hoomas
🟢هوش مصنوعی ChatGPT به قابلیت ضبط صدای جلسات و تبدیل آنها به متن مجهز شد
🔸شرکت #OpenAI با معرفی قابلیتهای جدیدی مثل حالت ضبط و اتصال به منابع داخلی کاربران مانند گوگل درایو و دراپباکس، ChatGPT را بیشازپیش به ابزاری کاربردی برای افراد حرفهای تبدیل کرده است. این قابلیتها شامل دو ویژگی مهم «Record Mode» و «Connectors» میشود.
🔸در تازهترین بهروزرسانی #ChatGPT، کاربران طرحهای پولی این ابزار میتوانند با قابلیت Record Mode جلسات صوتی خود را ضبط کنند، از آنها متن تهیه کنند، نکات مهمش را استخراج کنند و حتی از چتجیپیتی بخواهند در آینده به سؤالاتی براساس محتوای جلسات پاسخ دهد. قابلیت Record Mode فعلاً برای کاربران نسخه Team چتجیپیتی در سیستمعامل macOS فعال شده است.
🔸قابلیت Connectors به ChatGPT اجازه میدهد به سرویسهایی مانند Gmail ،Google Drive ،Outlook ،Teams و Linear متصل شود. این اتصال به کاربران اجازه میدهد از اطلاعات واقعی و روزمره خود در تحلیلها، تولید متن و تصمیمگیریهای مبتنیبر داده استفاده کنند.
➖➖➖➖➖
🗳@hoomas
🟢 کمپانی OpenAI مدل جدید o3-pro را معرفی کرد؛ عملکرد قابلاعتمادتر اما با سرعت کمتر
🔸کمپانی #OpenAI که بهتازگی قیمت مدل استدلالگر o3 را کاهش داده بود، نسخه جدیدی از این مدل با نام o3-pro را در دسترس توسعهدهندگان قرار داده است. o3-pro قدرت زیادی دارد و هدفش ارائه پاسخهای دقیقتر و استفاده گستردهتر از ابزارهای نرمافزاری است.
🔸مدل o3-pro به گونهای طراحی شده که توانایی استدلال عمیقتر و ارائه پاسخهای قابلاعتمادتر را فراهم کند و در مقایسه با نسخه قبلی، به ابزارهای بیشتری برای یکپارچهسازی نرمافزاری دسترسی داشته باشد. ویژگیهایی که میتوانند برای شرکتها و توسعهدهندگانی که به دنبال دقت و جزئیات بالا هستند، مفید باشند.
🔸بااینحال، OpenAI هشدار داده که سرعت پاسخدهی این مدل پایینتر از مدلهایی مانند o1-pro است، زیرا برای ارائه پاسخهای دقیقتر، به مجموعهای از ابزارهای محاسباتی دسترسی دارد.
🔸طبق ارزیابیهای داخلی، o3-pro در زمینههایی مانند علوم، آموزش، برنامهنویسی، کسبوکار و نگارش عملکرد بهتری نسبت به مدل پایه دارد و دستورالعملها را دقیقتر اجرا میکند.
➖➖➖➖➖
🗳@hoomas
🟢 مدیرعامل #OpenAI: بشریت به ساخت ابرهوشمندی دیجیتال نزدیک شده است
🔸سم آلتمن روز گذشته در یک پست وبلاگی اعلام کرد که دوران جدیدی در تاریخ بشر آغاز شده است. او با استفاده از اصطلاحات اخترفیزیک، استدلال کرد که ما از «افق رویداد» (Event Horizon) عبور کردهایم؛ نقطهای بیبازگشت که در آن پیشرفت هوش مصنوعی قطعی است. به گفته آلتمن، «خیزش آغاز شده و بشریت به ساخت ابرهوشمندی دیجیتال نزدیک شده است.»
🔸این تحلیل درحالی مطرح میشود که نگرانیها درباره پیشی گرفتن هوش مصنوعی از هوش انسانی – مفهومی که به آن «تکینگی» (Singularity) گفته میشود – درحال افزایش است. بااینحال، آلتمن معتقد است این تحول نه یک رخداد ناگهانی و فاجعهبار، بلکه یک «تکینگی ملایم» و تدریجی است که میتوان آن را مدیریت کرد.
🔸آلتمن برای اثبات ادعای خود به محبوبیت و نفوذ گسترده ChatGPT اشاره کرد. براساس آمار، این چتبات در ماه مه ٢٠٢۵ حدود ٨٠٠ میلیون کاربر فعال هفتگی داشته است. او گفت: «صدها میلیون نفر هر روز و برای کارهایی که پیوسته مهمتر میشوند، به آن تکیه میکنند.» این نفوذ گسترده، بهرغم مسائل حقوقی مداوم و درخواستها برای توقف توسعه هوش مصنوعی، نشاندهنده سرعت بالای این تحول است.
➖➖➖➖➖
🗳@hoomas
🟢 هوش مصنوعی ChatGPT قابلیت جدید مطالعه بههمراه هوش مصنوعی را آزمایش میکند
🔸شرکت #OpenAI درحال آزمایش ویژگی جدیدی به نام مطالعه با یکدیگر (Study Together) در ChatGPT است. این قابلیت جدید بهجای ارائه پاسخهای آماده، با پرسیدن سؤالات هدفمند کاربر را به تفکر و یادگیری فعال وامیدارد و به نظر میرسد پاسخی مستقیم به نگرانیها پیرامون استفاده از هوش مصنوعی برای تقلب در تکالیف دانشگاهی باشد.
🔸برخی از کاربران اشتراکی #ChatGPT در ردیت میگویند گزینه جدید Study Together به فهرست ابزارهای این چتبات اضافه شده است. این حالت جدید، رویکرد ChatGPT را از یک ابزار پاسخدهی به یک ابزار آموزشی تعاملی تغییر میدهد.
🔸براساس گزارشهای اولیه کاربران، این قابلیت جدید بهجای ارائه مستقیم پاسخ به سؤالات، کاربر را با پرسشهای متوالی به چالش میکشد و او را مجبور میکند تا خودش به پاسخ برسد. این رویکرد شباهت زیادی به پلتفرم آموزشی LearnLM گوگل دارد و به نظر میرسد تلاشی از سوی OpenAI برای تغییر نقش ChatGPT از یک ابزار کمکی به یک معلم خصوصی هوشمند است.
➖➖➖➖➖
🗳@hoomas
2.69M حجم رسانه بالاست
مشاهده در ایتا
🟢شرکت OpenAI از ChatGPT Agent برای انجام خودکار کارها رونمایی کرد
🔸شرکت #OpenAI از ایجنت هوش مصنوعی جدیدی به نام ChatGPT Agent رونمایی کرده که میتواند روی یک کامپیوتر مجازی، کارهای شما را تکمیل کند. این ایجنت روی یک مدل اختصاص توسعه پیدا کرده که البته نام آن اعلام نشده است.
🔸مدل مورد استفاده در ChatGPT Agent با استفاده از وظایف پیچیده آموزش دیده است که نیازمند ابزارهای مختلفی مانند مرور متن و تصویر میشود. شرکت OpenAI برای توسعه ChatGPT Agent از تیمهای Operator و Deep Research استفاده کرده است.
🔸این ابزار میتواند کارهای مختلفی انجام دهد، برای مثال میتوانید با اتصال گوگل کلندر به آن، یک قرار را تنظیم کنید. این ابزار میتواند برای ارائهتان اسلاید بسازد یا حتی کد اجرا کند.
🔸به گفته سم آلتمن، مدیرعامل OpenAI، این ابزار اگرچه کاربردهای زیادی دارد، اما خطرات بالقوه آن هم قابلتوجه هستند. در همین راستا OpenAI اقدامات حفاظتی زیادی برای آن انجام داده است، بااینحال کاربران همچنان باید مراقب باشند و دسترسیهای زیادی به آن ندهند.
🔸قابلیت ChatGPT Agent از امروز در اختیار کاربران سرویسهای اشتراکی پرو، پلاس و Team قرار میگیرد و برای استفاده از آن باید در منوی ChatGPT، گزینه Agent Mode را انتخاب کنید.
➖➖➖➖➖
🗳@hoomas
📱مدل جدید OpenAI در المپیاد جهانی ریاضی ٢٠٢۵ در سطح مدال طلا عمل کرد
🔸مدل زبانی جدید OpenAI که برای استدلال و حل مسائل پیچیده طراحی شده، موفق به کسب عملکردی در سطح مدال طلای المپیاد جهانی ریاضی (IMO) سال ٢٠٢۵ شده است.
🔸طبق اعلام «الکساندر وی»، پژوهشگر #OpenAI، این مدل در شرایطی مشابه شرکتکنندگان انسانی، یعنی دو جلسه 4.5 ساعته بدون دسترسی به ابزار، اینترنت یا منابع خارجی، آزمایش شده است. مدل OpenAI صرفاً با خواندن توضیح رسمی مسائل و ارائه اثباتهایی به زبان طبیعی توانسته به این دستاورد بزرگ برسد.
🔸وی توضیح میدهد که این موفقیت از چند جهت اهمیت دارد. اول اینکه مسائل IMO به تفکر خلاق و استدلال مداوم در بازه زمانی طولانی نیازمند هستند. به گفته او، مسیر پیشرفت مدلهای زبانی در درک ریاضی از حل مسائل سادهای مانند GSM8K با زمان حل زیر یک دقیقه آغاز شده و حالا به IMO با بازه زمانی ١٠٠ دقیقه رسیده است.
🔸دوم اینکه توضیحات IMO چندصفحهای هستند و ارزیابی آنها دشوارتر است و به همیندلیل، عبور از چارچوبهای سنتی یادگیری تقویتی برای رسیدن به استدلالهای دقیق انسانی، دستاوردی قابلتوجه محسوب میشود. نمونهای از سؤالات این آزمون در تصویر زیر آمده است.
🔸به گفته پژوهشگر OpenAI، این مدل زبانی جدید توانسته 5 مسئله از ۶ مسئله المپیاد ٢٠٢۵ را حل کند و در مجموع امتیاز ٣۵ را از مجموع 42 امتیاز ممکن کسب کند. وی ادعا میکند که این امتیاز معادل مدال طلا است. همچنین هر پاسخ مدل توسط سه مدالآور سابق IMO بهصورت مستقل بررسی شده و نمره نهایی با اجماع کامل آنها تعیین شده است.
➖➖➖➖➖
🗳@hoomas
💢 پس از OpenAI، هوش مصنوعی گوگل هم در المپیاد ریاضی در سطح مدال طلا ظاهر شد
🔸مدل پیشرفته جمینای موسوم به Gemini Deep Think موفق شد در المپیاد جهانی ریاضی ۲۰۲۵ با حل کامل پنج مسئله از شش مسئله به امتیاز معادل مدال طلا دست یابد. این موفقیت رسماً توسط برگزارکنندگان المپیاد تأیید شده است.
🔸المپیاد جهانی ریاضی (IMO) معتبرترین و دشوارترین رقابت برای ریاضیدانان جوان در سراسر جهان است و در سالهای اخیر به معیاری برای سنجش تواناییهای استدلال پیشرفته هوش مصنوعی تبدیل شده است. سال گذشته، سیستمهای AlphaProof و AlphaGeometry 2 گوگل با حل چهار مسئله، به استاندارد مدال نقره دست یافتند. اما آن موفقیت محدودیت بزرگی داشت: مسائل باید ابتدا توسط یک متخصص از زبان عادی به یک زبان برنامهنویسی خاص ترجمه میشدند و فرایند حل مسئله نیز چندین روز طول میکشید.
🔸اما امسال، جمینای دیپتینک توانست با زبان طبیعی مسائل را درک کند. همچنین در محدوده زمانی ۴.۵ ساعته مسابقه، مانند یک شرکتکننده انسانی، راهحلهای کامل و دقیق خود را ارائه دهد. در این المپیاد مدل جدید #OpenAI نیز در سطح مدال طلا عمل کرد. البته برخلاف OpenAI، #گوگل طبق قوانین تعیینشده توسط IMO بازی کرد. اما OpenAI مسیر متفاوتی را در پیش گرفت. آنها بهجای ارسال پاسخها به کمیته رسمی المپیاد، یک هیئت داوری اختصاصی برای خود تشکیل دادند.
➖➖➖➖➖
🗳@hoomas
🟢 هشدار سم آلتمن: کاربران نباید اطلاعات حساس خود را با ChatGPT در میان بگذارند
🔸سم آلتمن، مدیرعامل #OpenAI، در مصاحبه جدیدی به کاربران هشدار داده که صنعت هوش مصنوعی هنوز راهی برای محافظت کامل از حریم خصوصی آنها در گفتگوهای حساس پیدا نکرده است. به گفته او، هنگامی که از چتباتها مانند #ChatGPT برای درمان یا دریافت حمایت احساسی استفاده میکنید، چیزی به نام محرمانگی بین پزشک و بیمار وجود ندارد.
🔸سم آلتمن در پاسخ به پرسشی درباره تعامل هوش مصنوعی با سیستمهای قانونی فعلی، میگوید یکی از مشکلات اصلی نبود یک چارچوب حقوقی یا سیاستگذاری مشخص برای هوش مصنوعی، این است که برای گفتگوهای کاربران با این فناوری، محرمانگی قانونی وجود ندارد.
🔸به گفته آلتمن، در صورت ثبت یک شکایت حقوقی، این موضوع میتواند به یک نگرانی جدی در زمینه حریم خصوصی کاربران تبدیل شود، چرا که درحالحاضر OpenAI از نظر قانونی موظف است محتوای این گفتگوها را در صورت نیاز ارائه کند.
➖➖➖➖➖
🗳@hoomas