
Dacă ați auzit de BrowserOS și v-ați întrebat de ce atât de mulți oameni vorbesc despre un „browser cu creier”, iată imaginea completă. BrowserOS este un browser open-source care încorporează agenți de inteligență artificială capabili să înțeleagă și să execute instrucțiuni în limbaj natural.Dând clic, tastând și navigând în numele dvs., utilizând sesiunile dvs. conectate și accesul local. Toate acestea cu o abordare implicită de confidențialitate și fără a vă baza pe infrastructura cloud pentru datele dvs. personale.
Propunerea nu este doar o altă idee aleatorie din lumea browserelor: BrowserOS s-a născut ca o ramură a Chromium, cu compatibilitate pentru extensiile Chrome și un obiectiv clar.: să fie o alternativă deschisă și axată pe confidențialitate la soluții precum Atlas (ChatGPT)Comet (Perplexity) sau Dia, pe lângă browserele tradiționale. Ideea este simplu de explicat și puternică în impactul său: descrii sarcina, iar un agent o execută de pe propriul computer, cu acreditările tale și fără a trimite istoricul tău către terți.
Ce este BrowserOS și cum este diferit?
În esență, BrowserOS este un browser care rulează nativ agenți de inteligență artificială.Îți permite să scrii instrucțiuni ca și cum le-ai explica unui coleg, iar sistemul se ocupă de efectuarea secvenței de acțiuni: deschiderea paginilor, pornirea căutărilor, completarea formularelor sau extragerea datelor. Nu este un asistent extern care „se uită” la browserul tău: agenții se află chiar în BrowserOS.
Deoarece este construit pe Chromium, experiența pare familiară din primul minutO interfață familiară, compatibilitate cu extensiile, import de date Chrome și adoptare practic instantanee pentru cei deja familiarizați cu ecosistemul. Acest efect de „senzație de acasă” reduce dificultățile atunci când începeți automatizarea fără a sacrifica utilizările zilnice.
De ce acum: momentul pentru agenți în browser
În ultimele luni, instrumentele de programare asistată de inteligență artificială au multiplicat productivitatea dezvoltatorilor. Cu toate acestea, milioane de lucrători în domeniul cunoștințelor rămân blocați în sarcini repetitive ale browserului.Copierea și lipirea, completarea formularelor, exportarea datelor din tablourile de bord, lansarea campaniilor etc. Este un blocaj zilnic.
Echipa BrowserOS sugerează că, pentru prima dată de la vremea Netscape, Avem oportunitatea de a reimagina browserul pentru muncă realăDacă IA „scrie” deja proiecte întregi, de ce nu poate apăsa butoane, naviga printr-o interfață web sau concatena acțiuni așa cum ai face-o tu, dar fără ca tu să fii mereu la curent?
Problemele pe care le abordează BrowserOS
Înainte de BrowserOS, implementarea agenților în sarcini din lumea reală eșua din motive foarte specifice. Proiectul identifică trei obstacole principale care au împiedicat adoptarea sa în masă.în special în companii:
- Acces la sesiuni autentificateMulte soluții de agenți rulează pe mașini la distanță și nu pot funcționa cu conturile dvs. reale (Gmail, LinkedIn, instrumente corporative). Prin urmare, acestea nu sunt eficiente în îndeplinirea sarcinilor din lumea reală.
- Fragmentarea sculelorUnii agenți comunică cu serverele MCP, alții efectuează doar automatizare web, iar alții înlănțuie API-uri, precum Zaps-urile. Ceea ce lipsește este o „set de instrumente” unificată pentru construirea de fluxuri complexe.
- Cutie neagră și lacătMai multe browsere populare sunt produse de căutare sau publicitate. Nu își deschid prompturile sau mecanismele interneÎți atribuie un LLM specific și direcționează datele către serverele lor. Pentru multe companii, acest lucru este categoric interzis.
BrowserOS răspunde de la zero: agenți în browserul dvs., care rulează pe computerul dvs.Combinând MCP și automatizarea, sub o filozofie 100% deschisă, conform căreia poți audita și crea fork-uri oricând dorești, această combinație rezolvă ceea ce până acum făcea nefezabilă delegarea muncii serioase către inteligența artificială în browser.
Cum funcționează BrowserOS și primii pași
Fluxul este direct: Descarci și instalezi BrowserOS la fel ca orice alt browserTe conectezi la site-urile pe care le utilizezi zilnic și, de acolo, descrii sarcinile în limbaj natural. Agentul acționează în contextul tău real, cu permisiunile și sesiunile tale active, ca și cum ai fi în fața ecranului.
- Descărcare și instalare BrowserOS pentru sistemul dvs. (disponibil pentru macOS, Windows și Linux). Dacă vă preocupă instalarea pe Linux, este disponibil ca AppImage. pe GitHub.
- Importați datele dvs. Chrome dacă sunteți interesat să păstrați marcajele, istoricul sau setările.
- Conectează-ți furnizorul de inteligență artificială: OpenAIModele antropologice sau locale prin Ollama/LM Studio, cu propriile chei.
- Începeți automatizarea: formulați obiective în text și lăsați agentul să execute pașii pe web.
De asemenea, puteți combinați automatizarea browserului cu serverele MCP și apeluri API în același flux. Această combinație vă permite să construiți asistenți capabili să extragă date, să le proceseze într-un model și să actualizeze foi de calcul sau instrumente SaaS, toate conectate la un singur agent.
Caracteristicile cheie ale BrowserOS care fac diferența
- Agenți de construire în limbaj naturalSpune ce vrei, fără programare.
- Libertatea modelelorAdu-ți cheile și schimbă între programele de masterat în drept sau folosește modele locale.
- Este un browser „normal”Bază de crom, Funcționează extensiile tale Chrome?.
Confidențialitatea este un pilon al designului: Datele, istoricul și sesiunile dumneavoastră rămân pe computer.Fără telemetrie invazivă sau dependență de cloud-uri externe. Dacă preferați, puteți lucra exclusiv cu modele locale și închide complet robinetul.
Și dacă nu era suficient, Lucrează la un blocator de reclame bazat pe inteligență artificială care promite să acopere scenarii mai complexe decât filtrele statice. Și, pentru dezvoltatori și utilizatori avansați, există suport pentru utilizarea browserului ca server MCP, integrându-l cu instrumente precum claude-code o gemini-cli.
Integrări, MCP și utilizare din instrumente externe
Unul dintre cele mai puternice atuuri ale sale este faptul că BrowserOS poate funcționa ca un server MCPAceasta înseamnă că alte aplicații compatibile cu protocolul (cum ar fi cele menționate) claude-code o gemini-cliAceștia pot „comunica” cu browserul dvs. și pot delega sarcini ale interfeței web agenților lor.
Ceea ce este interesant este orchestrația: Nu trebuie să alegi între automatizarea browserului sau apelarea unei API.Puteți face ambele lucruri în aceeași rețetă de agent. De exemplu, puteți extrage date dintr-un portal cu o interfață complexă, le puteți procesa cu un model și apoi încărca rezultatul într-o foaie de calcul sau într-un CRM, fără a combina manual instrumentele.
Comparație rapidă cu Chrome, Brave, Arc/Dia și Perplexity Comet
Comparativ cu Chrome
Datorită sistemului open source al Chromium, BrowserOS moștenește fundația, dar Chrome a trecut ani fără progrese majore în domeniul inteligenței artificiale native pentru automatizare.Fără MCP, fără agenți locali, fără acel strat de orchestrare integrat, rămâne doar un browser excelent... fără un „asistent de tip „click-for-you”.
Înfruntând curajosul
Brave a deschis calea în intimitate, dar Accentul lor este împărțit între criptomonede, căutare, VPN-uri și multe altele.BrowserOS își face propriile lucruri: inteligență artificială în browser și automatizarea muncii reale.
Arc/Diametru cu orientare frontală
Mulți oameni au apreciat propunerea lui Arc, dar Și-a închis codul și i-a lăsat pe utilizatori în incertitudine.În BrowserOS este exact opusul: 100% deschis, auditabil, cu posibilitate de creare a unei bifurcații, cu o comunitate implicată și fără dependență de un singur furnizor.
Cometa Perplexității în Confruntare
Perplexity este, în cele din urmă, o companie de căutare și publicitate. Istoria ta poate deveni un produsÎn BrowserOS, promisiunea este clară: date locale și control complet din partea ta.
Securitate, confidențialitate și licențiere
Filosofia este „privilegiul pe primul loc”: Folosești propriile chei API sau modele locale cu Ollama/LM StudioTu alegi ce se afișează și ce nu pe dispozitivul tău și păstrezi istoricul și sesiunile departe de terți.
La nivel juridic și comunitar, BrowserOS este un software gratuit licențiat sub AGPL-3.0Poți vedea cum este realizat, poți revizui instrucțiunile sistemului, poți propune modificări, poți crea o ramură a proiectului și poți contribui. Toate acestea în spiritul „făcut cu dragoste din San Francisco” menționat de creatorii săi.
Comunitate, cifre și impulsul proiectului
Interesul este palpabil. Se mândrește cu peste 4,3 mii de stele pe GitHub, peste 25.000 de descărcări și o comunitate Discord de peste o mie de utilizatori. de persoane care participă activ. Într-un alt fragment, apar valori precum „6,3k” și „558” (legate de depozit, probabil stele/urmăritori/ramuri), sugerând o tendință ascendentă.
Din punct de vedere tehnic, proiectul se remarcă prin fundația sa C++ peste gigantul Chromium, o călătorie solicitantă care necesită multă muncă asiduă și menținerea compatibilității cu schimbările din amonte, continuând în același timp inovația la nivelul agentului.
Cazuri de utilizare și demonstrații
Gândește-te la sarcini din lumea reală: Identificați profilurile de interes dintre aplicațiile dvs. LinkedIn și adăugați-le într-o foaie de calcul GoogleCompletați formulare lungi, colectați date de pe mai multe site-uri web sau pregătiți o prezentare preliminară cu informații cheie pentru o întâlnire. Descrieți informațiile în text, iar agentul navighează și acționează așa cum ați face-o dumneavoastră.
Există materiale audiovizuale care prezintă conceptul în acțiune: demonstrații precum „HackerNews.top.3.mp4”, „use-browserOS-to-chat.mp4” sau „use-browserOS-to-extract.mp4” Ei predau totul, de la conversații asistate până la extragerea datelor în contexte reale, subliniind faptul că automatizarea are loc în contextul tău autentic.
Viziune: Browserul ca „sistem de operare” pentru agenți
Companiile se află în browser: Salesforce, SAP, Workday, instrumente interne… O armată de lucrători în domeniul cunoștințelor își petrece 60-80% din zi pe aplicații webDacă un agent poate da clic și tasta ca o persoană, poate automatiza practic orice interfață, inclusiv pe cele fără API-uri.
Viziunea prezentată de proiect este că IT-ul poate implementa „agenți-angajați” reutilizabili„Agentul de cheltuieli” al companiei, „agentul de publicitate Facebook” partajat în comunitate, pe care îl adaptezi la fluxul tău de lucru etc. Mai puține sarcini mecanice, mai multă concentrare pe ceea ce adaugă valoare.
Cine se află în spatele BrowserOS
Nucleul proiectului este condus de doi frați gemeni cu o vastă experiență în Big Tech. Nikhil a lucrat la backend-ul Reels și la feed-ul de Facebook folosind C++ și sisteme.Nithin a fost inginer ML la YouTube, participând la primul model major de recomandare (LRM) al platformei. Această combinație de nivel scăzut iar stratul de inteligență artificială le oferă libertatea de a lucra cu Chromium și, în același timp, de a construi „creierul agentului” deasupra acestuia.
- Experiență în C++ și sisteme la scară largă: întreținerea serviciilor critice și de înaltă performanță.
- Specializare în ML și sisteme de recomandare: înțelegere aprofundată a modelelor moderne și a implementării lor.
Voci din comunitate și alternative mai puțin cunoscute
Printre utilizatorii avansați există o apetit pentru browsere „diferite” cu potențial. Au fost testate alternative precum Wavebox, Ulaa, Arc, Ghost Browser sau Thorium.Zen Browser este lăudat pentru productivitatea sa (chiar dacă nu este bazat pe Chromium). Aceste teste menționează că Wavebox este foarte cuprinzător, dar poate fi copleșitor și că deblocarea întregului său potențial consumă mult timp; Ulaa se laudă cu confidențialitatea, dar include prea multe funcții suplimentare; Arc a generat reacții mixte; iar Ghost Browser nu a convins pe toată lumea.
În ceea ce privește toriul, se aude că Este foarte rapid, dar cu unele probleme de securitate.De aceea, unii oameni o amână. Și adesea, recomandarea este să nu se opteze pentru cele mai cunoscute, deoarece au încercat deja vreo douăzeci, iar scopul este de a descoperi rarități care oferă ceva cu adevărat nou.
Scurt ghid pentru utilizarea agenților
Odată ajuns înăuntru, „momentul magic” vine atunci când descrii sarcini reale. În loc să ceară „să caute cutare lucru” și să returneze un rezumat, agentul efectuează interacțiunea în browserul tău.Dacă site-ul web nu are o API, nu contează: există o interfață cu utilizatorul, există acțiuni pe care un agent le poate reproduce cu exactitate.
- Descrie-ți obiectivulDe exemplu, localizarea anumitor contacte într-o rețea profesională și transferul informațiilor acestora într-o foaie de calcul.
- Confirmați pașii dacă agentul ți le sugerează (util pentru a audita ce va face).
- Supraveghează prima dată Pentru a ajusta solicitările sau regulile, reutilizați rețeta.
Utilizarea MCP și capacitatea de a „îmbina” automatizarea, API-urile și modelele permit ca un singur agent rezolvă procese complete end-to-end, ceva ce anterior necesita lipirea mai multor unelte împreună cu bandă adezivă.
Confidențialitate prin proiectare și controlul modelului
Un avantaj cheie este libertatea de a alege motorul de inteligență artificială. Poți lucra cu OpenAI, Anthropic sau poți păstra totul local cu Ollama/LM Studio.Ruta este ajustată în funcție de cost, latență sau sensibilitatea proiectului. Cei care prioritizează confidențialitatea absolută au o rută 100% locală.
În plus, Proiectul publică și permite editarea prompturilor de sistemAcest lucru este mai puțin frecvent. Această transparență facilitează ajustarea comportamentului agentului la organizația sau cazul specific al dumneavoastră și auditarea modului în care acesta ia decizii.
Pași pentru a contribui la proiectul BrowserOS
Dacă crezi în idee și vrei să dai o mână de ajutor, există mai multe modalități de a o susține. Lasă o stea pe GitHub Ajută la creșterea vizibilității; descărcarea și utilizarea acestuia oferă informații telemetrice interesante (dacă îl activezi) și feedback; iar alăturarea la Discord îți permite să propui, să descoperi și să testezi funcții noi.
În cele din urmă, site-ul oficial afișează de obicei o reamintire a descărcați browserul pentru sistemul dvs.Dacă dorești, poți importa datele tale Chrome și poți conecta furnizorul tău de inteligență artificială preferat. De acolo, trebuie doar să-ți creezi agenții și să partajezi ce funcționează pentru tine.
Privind imaginea de ansamblu, BrowserOS se impune ca un... Browser open source cu o abordare axată pe agenți, prioritizând confidențialitatea, bazat pe Chromium și cu o comunitate în creștere.Combină compatibilitatea cu extensii, MCP, suport pentru modele locale (Ollama/LM Studio) și un angajament deschis care include o licență AGPL-3.0 și prompturi editabile. Spre deosebire de Chrome, Brave, Arc/Dia sau alte oferte bazate pe reclame și căutări, își propune să aducă „magia” inteligenței artificiale direct pe site-ul unde lucrați în fiecare zi. Și, deși mai sunt detalii de finisat (cum ar fi un blocator de reclame bazat pe inteligență artificială care va fi disponibil în curând sau probleme ocazionale de instalare pe Windows), ritmul și implicarea utilizatorilor indică un proiect în creștere, construit cu dragoste în San Francisco și cu dorința de a transforma web-ul dintr-un simplu lanț de clicuri într-o platformă pentru agenții care lucrează alături de dvs.