Google Gemini Pro 1.5重大更新:新增音頻理解、單次處理任何格式數(shù)據(jù)、更強(qiáng)大的函數(shù)調(diào)用和JSON模式,DataLeanrerAI實(shí)測(cè)音頻理解能力優(yōu)秀,且同時(shí)Gemini 1.5 Pro 開放 API 讓開發(fā)者申請(qǐng)使用!輕松獲取Gemini 1.5 Pro API Key教程:開發(fā)者申請(qǐng)部署ai應(yīng)用。
Gemini Pro 1.5 超過(guò)180個(gè)國(guó)家或地區(qū)的Gemini API公測(cè)環(huán)境提供, 引入了官方改進(jìn)的音頻/視頻(語(yǔ)言)理解能力和新的file API,以便于實(shí)時(shí)大文件訪問(wèn)。

Gemini 1.5 Pro的主要更新內(nèi)容
全球可用性:
Gemini 1.5 Pro現(xiàn)已在超過(guò)180個(gè)國(guó)家或地區(qū)的Gemini API公測(cè)環(huán)境提供,使得全球開發(fā)者都能訪問(wèn)并利用這一新型模型。
官方音頻/視頻(語(yǔ)言)理解能力:
引入了官方改進(jìn)的音頻(語(yǔ)言)理解能力,這意味著Gemini 1.5 Pro能夠更精確地解析和理解音頻輸入,為開發(fā)者提供更豐富的語(yǔ)言識(shí)別和處理工具。
新的file API:
新增的file API使得文件大小不再成為限制,使開發(fā)者能夠更高效地處理應(yīng)用中的大文件傳輸,視頻和音頻文件的處理。
JSON解析:
JSON能力升級(jí),包括多套綜合的JSON解析器架構(gòu),極大地提高了數(shù)據(jù)解析的精度和性能。
功能和接口:
改進(jìn)了功能和接口調(diào)用,開發(fā)者可以選擇不同的接口實(shí)現(xiàn)功能調(diào)試,增強(qiáng)了系統(tǒng)接口的靈活性和適用性。
新的文本嵌入模型:
推出了性能優(yōu)越的最新一代文本嵌入模型(text-embedding-004),在MTEB基準(zhǔn)測(cè)試中顯示出比前幾代模型更優(yōu)越的綜合性能,為文本分析和語(yǔ)義理解提供了強(qiáng)大的支持。
更廣泛的輸入格式支持:
Gemini 1.5 Pro擴(kuò)展了對(duì)不同輸入格式的支持,包括音頻和視頻,并計(jì)劃很快支持圖片的內(nèi)容和語(yǔ)言(語(yǔ)言)跨模態(tài)轉(zhuǎn)換的API交互,為開發(fā)者提供更多元化的應(yīng)用可能。
這些更新不僅展示了Google對(duì)AI技術(shù)不斷創(chuàng)新的承諾,也為開發(fā)者提供了更多工具和資源,以便更好地構(gòu)建和優(yōu)化他們的應(yīng)用程序和服務(wù)。

如何使用Gemini 1.5 Pro?
創(chuàng)建API密鑰:
在Google AI Studio創(chuàng)建或申請(qǐng)測(cè)試的API密鑰,開始構(gòu)建。
查看和使用擴(kuò)展的音頻/視頻(語(yǔ)言)能力:
在Gemini API和Google AI Studio中查看擴(kuò)展的音頻和視頻(語(yǔ)言)理解能力。
支持通過(guò)上傳到Google AI Studio的視頻和音頻自動(dòng)翻譯的音頻輸入,API交互的潛力巨大。
配置API調(diào)用:
在Google AI Studio的Gemini API中,通過(guò)交互式的分析與管理控制臺(tái)創(chuàng)建、定義角色、格式、時(shí)間和規(guī)則,以便于理解不同的輸入格式和行為。
JSON解析:
查看和使用改進(jìn)的JSON解析功能和新的文本嵌入模型,使你可以更靈活地處理大文本數(shù)據(jù)和結(jié)構(gòu)化的JSON響應(yīng)。你可以使用cURL或Python SDK支持的交互功能。
import requests
url = "https://gemini.api.google.com/v1/json-parser"
headers = {
"Authorization": "Bearer YOUR_API_KEY",
"Content-Type": "application/json"
}
payload = {
"json_input": {"example_key": "example_value"}
}
response = requests.post(url, headers=headers, json=payload)
print(response.json())
跨模態(tài)轉(zhuǎn)換的使用:
現(xiàn)在可以與Gemini API互動(dòng),將音頻、視頻和文本,甚至圖片進(jìn)行交互,功能適用范圍大大擴(kuò)展。
申請(qǐng)Gemini 1.5 Pro API步驟
訪問(wèn)Google AI Studio:
打開瀏覽器,訪問(wèn)Google AI Studio。
創(chuàng)建賬號(hào)或登錄:
使用Google賬號(hào)登錄,若沒(méi)有賬號(hào),請(qǐng)先注冊(cè)。
申請(qǐng)API密鑰:
在主頁(yè)上選擇“創(chuàng)建項(xiàng)目”。
輸入項(xiàng)目名稱并選擇相關(guān)設(shè)置。
在項(xiàng)目設(shè)置中選擇“API與服務(wù)”,然后選擇“創(chuàng)建API密鑰”。
預(yù)充值
輸入預(yù)充值金額,最低為5美元。
Gemini API支付覺(jué)得復(fù)雜的小伙伴可以參考:
國(guó)內(nèi)直連通過(guò)中轉(zhuǎn)平臺(tái)快速獲取Gemini API KEY 密鑰,以 uiuihao.com 平臺(tái)為例,申請(qǐng)并使用Gemini API密鑰比較友好,可以快速主力開發(fā)者更好的節(jié)省折騰申請(qǐng)Gemini API KEY 密鑰的時(shí)間。

配置和測(cè)試API:
在API控制臺(tái)中配置所需的API服務(wù)。
使用提供的API密鑰在開發(fā)環(huán)境中進(jìn)行測(cè)試和開發(fā)。
Gemini 1.5 Pro帶來(lái)了顯著的改進(jìn)和新功能,為開發(fā)者提供了強(qiáng)大的工具和更大的靈活性,幫助他們?cè)谌蚍秶鷥?nèi)更高效地開發(fā)和優(yōu)化應(yīng)用程序。通過(guò)詳細(xì)的API調(diào)用和配置步驟,開發(fā)者可以輕松上手并充分利用這些新特性。
審核編輯 黃宇
-
API
+關(guān)注
關(guān)注
2文章
2481瀏覽量
67059 -
AI
+關(guān)注
關(guān)注
91文章
41315瀏覽量
302690
發(fā)布評(píng)論請(qǐng)先 登錄
如何通過(guò)京東開放平臺(tái)API獲取店鋪所有商品列表
通過(guò)京東開放平臺(tái)API根據(jù)商品ID獲取商品詳情技術(shù)指南
獲取Ozon商品詳情數(shù)據(jù)的API接口技術(shù)指南
Gemini CLI 中轉(zhuǎn)站配置使用教程
如何從Target平臺(tái)獲取搜索列表數(shù)據(jù)的API接口
淘寶API SDK快速開發(fā)指南
谷歌正式推出最新Gemini 3 AI模型
小紅書獲取筆記正文和點(diǎn)贊數(shù)的API接口
京東平臺(tái)獲取商品詳情原數(shù)據(jù)API接口技術(shù)解析
京東API實(shí)時(shí)接口:京東商品評(píng)論數(shù)據(jù)接口
【Sipeed MaixCAM Pro開發(fā)板試用體驗(yàn)】基于MaixCAM-Pro的AI生成圖像鑒別系統(tǒng)
谷歌推出Gemini 2.5 Pro預(yù)覽版(I/O版本)
谷歌Gemini 2.5模型系列更新
Gemini API集成Google圖像生成模型Imagen 3
如何獲取 OpenAI API Key?API 獲取與代碼調(diào)用示例 (詳解教程)
開發(fā)者申請(qǐng)Gemini 1.5 Pro API Key:輕松獲取Gemini 1.5 Pro模型API Key并開發(fā)部署AI應(yīng)用
評(píng)論