Vietnam.vn - Nền tảng quảng bá Việt Nam

Gmail erhält das größte Spamfilter-Upgrade seit Jahren

Báo Thanh niênBáo Thanh niên06/12/2023

[Anzeige_1]

Google hat kürzlich einen Sicherheits-Blogbeitrag veröffentlicht, in dem es eine der größten Verbesserungen des Gmail-Spamfilters der letzten Jahre beschreibt. Es handelt sich um ein neues Textklassifizierungssystem namens Resilient and Efficient Text Vectorization (RETVec). Google sagt, es könne helfen, die Relevanz und Spezifität von Text zu erkennen – also E-Mails voller Sonderzeichen, Emojis, Rechtschreibfehlern und anderem Müll, der bisher für Menschen lesbar, für Maschinen jedoch nicht leicht zu verstehen war. Bisher konnten Spam-Nachrichten mit Sonderzeichen die Abwehr von Gmail problemlos überwinden.

Zwar würde jeder Spamfilter eine E-Mail mit dem Inhalt „Herzlichen Glückwunsch! Ihrem Jackpot-Konto wurde ein Guthaben von 1.000 $ gutgeschrieben“ wahrscheinlich aussortieren, doch die große Mehrheit der Buchstaben in der E-Mail befindet sich in den endlosen Tiefen des Unicode-Standards, wo Benutzer möglicherweise Zeichen finden, die aussehen, als gehörten sie zum regulären lateinischen Alphabet.

Laut Google ist RETVec darauf trainiert, zeichenbasierten Operationen wie Einfügungen, Löschungen, Rechtschreibfehlern, Homonymen, LEET-Ersetzungen und mehr standzuhalten. Das RETVec-Modell ist auf eine neue Zeichenkodierung trainiert, die alle Zeichen und Wörter im UTF-8-Satz effizient kodieren kann. Dadurch übertrifft RETVec die Leistung von über 100 Sprachen, ohne dass Nachschlagetabellen oder feste Vokabelgrößen erforderlich sind.

Gmail nâng cấp bộ lọc thư rác lớn nhất trong nhiều năm - Ảnh 1.

Dank RETVec kann Gmail Spam jetzt besser erkennen und filtern

Google bezeichnet den Unterschied als dramatisch. Methoden mit festen Vokabelgrößen oder Nachschlagetabellen für Homonyme sind ressourcenintensiv. RETVec hingegen verfügt nur über 200.000 statt Millionen Parameter. Googles Cloud-Plattform zur Spamfilterung ist zwar groß, kann aber auf einem lokalen Rechner ausgeführt werden. RETVec ist Open Source und Google hofft, damit Homonyme-Angriffe zu verhindern.

RETVec funktioniert ähnlich wie TensorFlow-Maschinenlernmodelle, die visuelle Ähnlichkeiten statt des tatsächlichen Zeicheninhalts zur Bestimmung der Wortbedeutung nutzen. Dieser Ansatz hat zu erheblichen Verbesserungen geführt. Google gibt an, dass der Ersatz des Gmail-Spam-Klassifikators durch RETVec die Spam-Erkennungsraten um 38 % gegenüber dem Ausgangswert verbessert und die Anzahl falscher Positivmeldungen um 19,4 % reduziert hat. Durch den Einsatz von RETVec konnte die TPU-Nutzung des Modells um 83 % reduziert werden, was die Einführung von RETVec zu einer der größten Verbesserungen der letzten Jahre macht. Das Unternehmen hat RETVec im vergangenen Jahr intern getestet und es nun für alle Gmail-Konten seiner Nutzer eingeführt.


[Anzeige_2]
Quellenlink

Kommentar (0)

No data
No data

Gleiches Thema

Gleiche Kategorie

Bild von dunklen Wolken, die kurz vor dem Einsturz stehen, in Hanoi
Der Regen strömte herab, die Straßen verwandelten sich in Flüsse, die Leute von Hanoi brachten Boote auf die Straßen
Nachstellung des Mittherbstfestes der Ly-Dynastie in der kaiserlichen Zitadelle Thang Long
Westliche Touristen kaufen gerne Spielzeug zum Mittherbstfest in der Hang Ma Street, um es ihren Kindern und Enkeln zu schenken.

Gleicher Autor

Erbe

Figur

Geschäft

No videos available

Aktuelle Veranstaltungen

Politisches System

Lokal

Produkt