OpenAI的12天發布會,都發布了哪些東西呢?
接近年底了,過去一周我非常的忙碌。隨著企業客戶越來越多,作為我們產品的重度使用者,同時也是服務客戶第一線的客戶成功。Google SEO培訓每天要用我們產品生成內容為自己公司的SEO服務,也要在客戶成功群中與客戶溝通解決客戶的一些產品使用問題以及SEO策略問題。另外每天還要時不時的去我們的AI SEO群參與討論,還要給一些潛在的客戶進行線上演示,所以每天就忙忙碌碌。
過去的一周也是各種AI發布忙碌的一周,首先是OpenAI破天荒的開啟了一個連續12天的產品發布會。別的不是,山姆奧特曼在營銷方面的確有想法。緊接著,谷歌發布了Gemini 2.0,硬剛OpenAI。而AI coding創業公司Devin也在這周正式GA了自己的產品,讓你能聘用Devin來作為自己的軟件工程師。
OpenAI的12天發布會
OpenAI的12天發布會已經過去了7天,我們先看看OpenAI都發布了哪些東西:
第1天:o1正式版與ChatGPT Pro
o1正式版:推出了o1的正式版本,相較于預覽版,性能提升,支持多模態輸入,能夠處理圖像和文本信息。
ChatGPT Pro:推出高級訂閱服務,每月200美元,提供無限制使用o1、o1-mini、GPT-4o和高級語音模式的權限,并引入o1 Pro模式,適用于處理復雜問題。
第2天:強化微調(Reinforcement Fine Tuning,RFT)
強化微調:推出RFT技術,允許用戶在自己的數據集上微調o1模型,提升其在特定領域的推理能力。
應用案例:與湯森路透合作,使用RFT微調o1 Mini,開發法律助理AI。
第3天:Sora正式發布
從宣布Sora到Sora正式發布,OpenAI歷經了一年時間。在這一年時間里,我們見到了很多的AI生成視頻的模型,包括我們國內出的海螺、即夢、可靈等等。而OpenAI也終于千呼萬喚始出來,于發布會第三天正式發布了Sora.
Sora的主要功能包括:
文本轉視頻:用戶可以輸入文本提示,生成相應的視頻內容。
圖像動畫:將靜態圖像轉化為動態視頻,賦予圖片生命力。
視頻混合:將不同的視頻片段融合,創造獨特的視覺效果。
訂閱與使用:
ChatGPT Plus用戶:每月支付20美元,可生成最多50個優先級視頻,分辨率最高為720p,時長最長為5秒。
ChatGPT Pro用戶:每月支付200美元,可無限制生成視頻,分辨率最高為1080p,時長最長為20秒,并可下載無水印視頻。
第4天:Canvas
Canvas:正式推出Canvas功能,提供可視化界面,方便用戶進行創作和編輯。
第5天:ChatGPT in Apple Intelligence
ChatGPT集成:將ChatGPT集成到蘋果的智能系統中,提升用戶體驗
第6天:Advanced Voice with Video&Santa Mode
高級語音與視頻:增強了語音和視頻功能,提供更自然的交互體驗。
圣誕模式:推出節日主題模式,增加趣味性。
第7天:Projects in ChatGPT
項目管理:在ChatGPT中引入項目管理功能,提升協作效率。
OpenAI的發布會已經發布了7天,還有5天,也就是下周會發布完成,接下來就是美國的圣誕假期了。話說連續12天發布會,不知道國內有多少朋友連續熬夜堅持看了已經發布的發布會。我是周末略微復習了一下,畢竟自己要做的工作要緊。另外,在發布會進行中的這些天,OpenAI的系統也出現了一次大型故障,一度有接近4個小時OpenAI所有的服務都不能響應。看來發布會魔咒是所有科技公司都挺難避免的。
谷歌Gemini 2.0
在OpenAI的12天發布會進行過程中,谷歌也于12月11日發布了最新的人工智能模型-Gemini 2.0。這個模型對于谷歌來講意義重大,它把AI深度整合到了幾乎所有的產品當中。這意味著谷歌將會有更多不同能力的AI agent來在自己的產品中提供服務。Gemini 2.0的主要的特性包括:
主要特性:
多模態能力:Gemini 2.0原生支持圖像和音頻生成,能夠處理和理解視頻、音頻和物理環境等多種輸入形式。
自主代理:引入了能夠自主執行任務的AI代理,減少對人類輸入的依賴。例如,Project Mariner是一個實驗性的Chrome擴展,能夠自主瀏覽網頁,完成在線購物等任務。
集成應用:Gemini 2.0已應用于多個項目,包括Project Astra,一個視覺導航系統,以及AI Overviews in Google Search,用于處理復雜的多步驟查詢。
開發者工具:推出了名為Jules的開發者工具,這是一個由Gemini 2.0 Flash驅動的編碼助手,能夠在GitHub中編寫代碼、修復錯誤,并創建和執行多步驟計劃。
作為在AI生成SEO領域的創業者,我們看到了谷歌把AI能力與搜索引擎的結合,在搜索結果中推出了AI Overview。在這個AI時代,作為大模型算法基礎Transformer的提出者,谷歌肯定不會缺席這個時代。
AI程序員Devin
這一輪生成式AI對于大部分有一定重復性勞動的知識工作必然會產生巨大的沖擊。比如我們正在做的SEO寫作產品對于傳統的SEO寫手的沖擊,而程序員和數據科學家們也忙不迭的在自掘墳墓,利用AI來替換程序員。比如大家都已經知道的Github copilot、Cursor,面向企業客戶的Codeium,當然還有Windsurf以及最近剛剛正式GA的Devin。
Devin在今年3月份發布了一些資料,然后就沒有了下文。直到這一周Devin終于正式GA了。如圖:
Devin的發布把自己定義為一個編碼的agent,可以聘用Devin為你的編程實習生,具體到價格嘛,500美金一個月。
Devin正式發布的這兩天,就有不少用戶開始氪金來雇傭Devin這個編程實習生。如圖:
當然,也有勸退的:
然而無論如何,我相信隨著AI推理能力的進一步增強。編程這個曾經吸納白領人數最多、也是相對最高薪的行業,必然會迎來一個巨大的挑戰。畢竟相當一部分程序員的日常工作是Ctrl+C,Ctrl+V,以及根據錯誤日志進行bug fix。在這方面,不知疲倦的AI的優勢還是很明顯的。
總結
兩年前OpenAI發布ChatGPT,讓本來已經有些冷寂的AI領域迎來了新的春天。這兩年AI生成內容的領域可以說取得了突飛猛進的發展,而隨著AI在更多知識工作場景的應用,AI Agent化的趨勢也是不可逆轉的。工業革命發展到最后是工業自動化,而信息技術革命我相信發展到最后是各種信息和知識的自動化。只不過在這當中,人要找到自己更合適的定位。






