Gemini-Powered Audio Overviews Arrive in Google Drive
Google has significantly enhanced its Drive platform by integrating a new Gemini-powered feature that automatically generates audio summaries of PDF documents.
This capability, known as Audio Overview, mirrors the functionality already present in NotebookLM and Google Search.
The core purpose of this tool is to transform lengthy, dense PDFs—such as contracts, research papers, or business reports—into conversational, "podcast-like" summaries.
This allows users to quickly absorb the key contents of a document without the time commitment of a line-by-line reading.
The feature is easily accessible within the Drive PDF viewer on the web, where users will find a new Audio Overview button.
Once activated, Gemini's language model generates a spoken summary, which typically ranges from two to ten minutes depending on the document's complexity and size.
This approach utilizes the same advanced AI technology that powers Gemini in other Google products, ensuring the conversion of key insights into a natural, easy-to-digest conversational format, making the information acquisition process more passive and efficient.
Upon completion, the generated audio summary can be played immediately from the Gemini side panel in Drive.
Furthermore, the audio file is automatically saved within a dedicated "Audio overviews" folder in the user's Drive.
A key advantage of this system is synchronization; the folder and its contents sync across all devices, making the audio summaries readily available for playback on both desktop and mobile platforms, supporting workflow flexibility for users on the go.
To streamline the user experience, Google has also incorporated an email notification system.
Users receive an alert once their audio file is ready, which not only provides a convenient reminder but also facilitates the immediate review or sharing of the summary with colleagues.
Currently, the Audio Overview feature is limited to supporting only English, although Google has indicated plans to introduce support for additional languages in future updates, broadening the feature's international utility.
The rollout of this powerful tool has commenced this week, targeting specific tiers of Google's subscriber base.
It is available to customers using Google Workspace Business Standard and Plus, Enterprise Standard and Plus, as well as Google One AI Pro and AI Ultra subscribers.
By combining this new PDF summarization with the existing "Listen" feature in Google Docs, Audio Overviews further solidifies Google’s strategic push to create a more conversational, AI-driven, and productive environment across its entire productivity suite.
Google Drive में Gemini-संचालित ऑडियो अवलोकन उपलब्ध
Google ने अपने Drive प्लेटफ़ॉर्म को Gemini-संचालित एक नए फ़ीचर के साथ जोड़कर काफ़ी बेहतर बनाया है जो PDF दस्तावेज़ों का ऑडियो सारांश स्वचालित रूप से तैयार करता है।
ऑडियो अवलोकन नामक यह सुविधा, NotebookLM और Google Search में पहले से मौजूद कार्यक्षमता की नकल करती है।
इस टूल का मुख्य उद्देश्य लंबे, सघन PDF—जैसे अनुबंध, शोध पत्र, या व्यावसायिक रिपोर्ट—को संवादात्मक, "पॉडकास्ट जैसे" सारांशों में बदलना है।
इससे उपयोगकर्ता किसी दस्तावेज़ की मुख्य सामग्री को बिना लाइन-दर-लाइन पढ़े जल्दी से समझ सकते हैं।
यह सुविधा वेब पर Drive PDF व्यूअर में आसानी से उपलब्ध है, जहाँ उपयोगकर्ताओं को एक नया ऑडियो अवलोकन बटन मिलेगा।
एक बार सक्रिय होने पर, Gemini का भाषा मॉडल एक मौखिक सारांश तैयार करता है, जो आमतौर पर दस्तावेज़ की जटिलता और आकार के आधार पर दो से दस मिनट तक का होता है।
यह दृष्टिकोण उसी उन्नत AI तकनीक का उपयोग करता है जो अन्य Google उत्पादों में Gemini को शक्ति प्रदान करती है, जिससे महत्वपूर्ण जानकारियों को एक स्वाभाविक, आसानी से समझ में आने वाले संवादात्मक प्रारूप में परिवर्तित किया जा सकता है, जिससे सूचना प्राप्ति प्रक्रिया अधिक निष्क्रिय और कुशल हो जाती है।
पूरा होने पर, जनरेट किया गया ऑडियो सारांश Drive में Gemini साइड पैनल से तुरंत चलाया जा सकता है।
इसके अलावा, ऑडियो फ़ाइल उपयोगकर्ता के Drive में एक समर्पित "ऑडियो अवलोकन" फ़ोल्डर में स्वचालित रूप से सहेजी जाती है।
इस प्रणाली का एक प्रमुख लाभ समन्वयन है; फ़ोल्डर और उसकी सामग्री सभी उपकरणों पर समन्वयित होती है, जिससे ऑडियो सारांश डेस्कटॉप और मोबाइल, दोनों प्लेटफ़ॉर्म पर आसानी से प्लेबैक के लिए उपलब्ध हो जाते हैं, जिससे उपयोगकर्ताओं के लिए कार्यप्रवाह में लचीलापन बना रहता है।
उपयोगकर्ता अनुभव को सुव्यवस्थित करने के लिए, Google ने एक ईमेल सूचना प्रणाली भी शामिल की है।
उपयोगकर्ताओं को उनकी ऑडियो फ़ाइल तैयार होने पर एक अलर्ट प्राप्त होता है, जो न केवल एक सुविधाजनक अनुस्मारक प्रदान करता है, बल्कि सहकर्मियों के साथ सारांश की तत्काल समीक्षा या साझा करने की सुविधा भी प्रदान करता है।
वर्तमान में, ऑडियो अवलोकन सुविधा केवल अंग्रेज़ी भाषा तक ही सीमित है, हालाँकि Google ने भविष्य के अपडेट में अतिरिक्त भाषाओं के लिए समर्थन शुरू करने की योजना का संकेत दिया है, जिससे इस सुविधा की अंतर्राष्ट्रीय उपयोगिता का विस्तार होगा।
इस शक्तिशाली टूल का रोलआउट इसी सप्ताह शुरू हुआ है, जो Google के ग्राहक आधार के विशिष्ट स्तरों को लक्षित करता है।
यह Google Workspace Business Standard और Plus, Enterprise Standard और Plus, साथ ही Google One AI Pro और AI Ultra ग्राहकों के लिए उपलब्ध है।
इस नए PDF सारांश को Google Docs में मौजूदा "Listen" सुविधा के साथ जोड़कर, ऑडियो अवलोकन Google के संपूर्ण उत्पादकता सूट में एक अधिक संवादात्मक, AI-संचालित और उत्पादक वातावरण बनाने के रणनीतिक प्रयास को और मज़बूत करता है।
జెమిని-ఆధారిత ఆడియో అవలోకనాలు Google డిస్క్లోకి వస్తున్నాయి
PDF పత్రాల ఆడియో సారాంశాలను స్వయంచాలకంగా రూపొందించే కొత్త జెమిని-ఆధారిత ఫీచర్ను ఇంటిగ్రేట్ చేయడం ద్వారా Google తన డ్రైవ్ ప్లాట్ఫామ్ను గణనీయంగా మెరుగుపరిచింది.
ఆడియో అవలోకనం అని పిలువబడే ఈ సామర్థ్యం, నోట్బుక్LM మరియు Google శోధనలో ఇప్పటికే ఉన్న కార్యాచరణను ప్రతిబింబిస్తుంది.
కాంట్రాక్టులు, పరిశోధనా పత్రాలు లేదా వ్యాపార నివేదికలు వంటి పొడవైన, దట్టమైన PDFలను సంభాషణాత్మక, "పాడ్కాస్ట్ లాంటి" సారాంశాలుగా మార్చడం ఈ సాధనం యొక్క ప్రధాన ఉద్దేశ్యం.
లైన్-బై-లైన్ పఠనం యొక్క సమయ నిబద్ధత లేకుండా వినియోగదారులు పత్రం యొక్క ముఖ్య విషయాలను త్వరగా గ్రహించడానికి ఇది అనుమతిస్తుంది.
ఈ ఫీచర్ వెబ్లోని డ్రైవ్ PDF వ్యూయర్లో సులభంగా యాక్సెస్ చేయగలదు, ఇక్కడ వినియోగదారులు కొత్త ఆడియో అవలోకనం బటన్ను కనుగొంటారు.
సక్రియం చేయబడిన తర్వాత, జెమిని యొక్క భాషా నమూనా మాట్లాడే సారాంశాన్ని ఉత్పత్తి చేస్తుంది, ఇది సాధారణంగా పత్రం యొక్క సంక్లిష్టత మరియు పరిమాణాన్ని బట్టి రెండు నుండి పది నిమిషాల వరకు ఉంటుంది.
ఈ విధానం ఇతర Google ఉత్పత్తులలో జెమినికి శక్తినిచ్చే అదే అధునాతన AI సాంకేతికతను ఉపయోగిస్తుంది, కీలక అంతర్దృష్టులను సహజమైన, సులభంగా జీర్ణమయ్యే సంభాషణా ఆకృతిలోకి మార్చడాన్ని నిర్ధారిస్తుంది, సమాచార సముపార్జన ప్రక్రియను మరింత నిష్క్రియాత్మకంగా మరియు సమర్థవంతంగా చేస్తుంది.
పూర్తయిన తర్వాత, ఉత్పత్తి చేయబడిన ఆడియో సారాంశాన్ని డ్రైవ్లోని జెమిని సైడ్ ప్యానెల్ నుండి వెంటనే ప్లే చేయవచ్చు.
ఇంకా, ఆడియో ఫైల్ స్వయంచాలకంగా వినియోగదారు డ్రైవ్లోని ప్రత్యేక "ఆడియో అవలోకనాలు" ఫోల్డర్లో సేవ్ చేయబడుతుంది.
ఈ వ్యవస్థ యొక్క ముఖ్య ప్రయోజనం సమకాలీకరణ; ఫోల్డర్ మరియు దాని కంటెంట్లు అన్ని పరికరాల్లో సమకాలీకరించబడతాయి, ఆడియో సారాంశాలను డెస్క్టాప్ మరియు మొబైల్ ప్లాట్ఫారమ్లలో ప్లేబ్యాక్ కోసం తక్షణమే అందుబాటులో ఉంచుతాయి, ప్రయాణంలో ఉన్న వినియోగదారులకు వర్క్ఫ్లో సౌలభ్యానికి మద్దతు ఇస్తాయి.
వినియోగదారు అనుభవాన్ని క్రమబద్ధీకరించడానికి, Google ఇమెయిల్ నోటిఫికేషన్ వ్యవస్థను కూడా చేర్చింది.
వినియోగదారులు వారి ఆడియో ఫైల్ సిద్ధమైన తర్వాత హెచ్చరికను అందుకుంటారు, ఇది అనుకూలమైన రిమైండర్ను అందించడమే కాకుండా సహోద్యోగులతో సారాంశాన్ని వెంటనే సమీక్షించడానికి లేదా పంచుకోవడానికి కూడా వీలు కల్పిస్తుంది.
ప్రస్తుతం, ఆడియో అవలోకనం ఫీచర్ ఇంగ్లీషుకు మాత్రమే మద్దతు ఇవ్వడానికి పరిమితం చేయబడింది, అయితే Google భవిష్యత్ నవీకరణలలో అదనపు భాషలకు మద్దతును ప్రవేశపెట్టాలని సూచించింది, ఫీచర్ యొక్క అంతర్జాతీయ యుటిలిటీని విస్తృతం చేస్తుంది.
ఈ శక్తివంతమైన సాధనం యొక్క విస్తరణ ఈ వారం ప్రారంభమైంది, ఇది Google సబ్స్క్రైబర్ బేస్లోని నిర్దిష్ట స్థాయిలను లక్ష్యంగా చేసుకుంది.
ఇది Google Workspace Business Standard మరియు Plus, Enterprise Standard మరియు Plus, అలాగే Google One AI Pro మరియు AI అల్ట్రా సబ్స్క్రైబర్లను ఉపయోగించే కస్టమర్లకు అందుబాటులో ఉంది.
ఈ కొత్త PDF సారాంశాన్ని Google డాక్స్లో ఉన్న "లిజెన్" ఫీచర్తో కలపడం ద్వారా, ఆడియో ఓవర్వ్యూలు దాని మొత్తం ఉత్పాదకత సూట్లో మరింత సంభాషణాత్మక, AI-ఆధారిత మరియు ఉత్పాదక వాతావరణాన్ని సృష్టించడానికి Google యొక్క వ్యూహాత్మక పుష్ను మరింత పటిష్టం చేస్తాయి.
No comments:
Post a Comment
Please Dont Leave Me