<?xml version="1.0" encoding="utf-8" ?>

<rss version="2.0" 
   xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
   xmlns:admin="http://webns.net/mvcb/"
   xmlns:dc="http://purl.org/dc/elements/1.1/"
   xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
   xmlns:wfw="http://wellformedweb.org/CommentAPI/"
   xmlns:content="http://purl.org/rss/1.0/modules/content/"
   >
<channel>
    
    <title>Paweł Goleń, blog - Formularz komentarzy &quot;Ciekawy(?) spam II&quot;</title>
    <link>https://archive.mroczna-zaloga.org/</link>
    <description>Paweł Goleń, blog - Zrzędzenie starego zgreda</description>
    <dc:language>pl</dc:language>
    <generator>Serendipity  - http://www.s9y.org/</generator>
    <pubDate>Sat, 15 Mar 2025 22:15:09 GMT</pubDate>

    <image>
        <url>https://archive.mroczna-zaloga.org/templates/bulletproof/img/s9y_banner_small.png</url>
        <title>RSS: Paweł Goleń, blog - Formularz komentarzy &quot;Ciekawy(?) spam II&quot; - Paweł Goleń, blog - Zrzędzenie starego zgreda</title>
        <link>https://archive.mroczna-zaloga.org/</link>
        <width>100</width>
        <height>21</height>
    </image>

<item>
    <title>buddy: Ciekawy(?) spam II</title>
    <link>https://archive.mroczna-zaloga.org/archives/1068-ciekawy-spam-ii.html#c4509</link>
            <category></category>
    
    <comments>https://archive.mroczna-zaloga.org/archives/1068-ciekawy-spam-ii.html#comments</comments>
    <wfw:comment>https://archive.mroczna-zaloga.org/wfwcomment.php?cid=1068</wfw:comment>

    

    <author>nospam@example.com (buddy)</author>
    <content:encoded>
    Sądzę, że tutaj są tylko dwie opcje: Xrummer albo Scrapebox, czyli generalnie programy do spamowania. W dodatku dosyć słabo użyte. Przynajmniej był to jakiś test na obronę przed spamem ;)  
    </content:encoded>

    <pubDate>Wed, 16 Nov 2011 08:08:36 +0100</pubDate>
    <guid isPermaLink="false">https://archive.mroczna-zaloga.org/archives/1068-guid.html#c4509</guid>
    
</item>
<item>
    <title>Paweł Goleń: Ciekawy(?) spam II</title>
    <link>https://archive.mroczna-zaloga.org/archives/1068-ciekawy-spam-ii.html#c4485</link>
            <category></category>
    
    <comments>https://archive.mroczna-zaloga.org/archives/1068-ciekawy-spam-ii.html#comments</comments>
    <wfw:comment>https://archive.mroczna-zaloga.org/wfwcomment.php?cid=1068</wfw:comment>

    

    <author>nospam@example.com (Paweł Goleń)</author>
    <content:encoded>
    Jakby było wspaniale, gdyby Google dawał mniej punktów treściom głupim :)  
    </content:encoded>

    <pubDate>Tue, 08 Nov 2011 13:58:33 +0100</pubDate>
    <guid isPermaLink="false">https://archive.mroczna-zaloga.org/archives/1068-guid.html#c4485</guid>
    
</item>
<item>
    <title>Jakub Jagiełło: Ciekawy(?) spam II</title>
    <link>https://archive.mroczna-zaloga.org/archives/1068-ciekawy-spam-ii.html#c4484</link>
            <category></category>
    
    <comments>https://archive.mroczna-zaloga.org/archives/1068-ciekawy-spam-ii.html#comments</comments>
    <wfw:comment>https://archive.mroczna-zaloga.org/wfwcomment.php?cid=1068</wfw:comment>

    

    <author>nospam@example.com (Jakub Jagiełło)</author>
    <content:encoded>
    Jest jedno ale. Google daje mniej punktów treściom mniej unikalnym.  
    </content:encoded>

    <pubDate>Mon, 07 Nov 2011 00:51:35 +0100</pubDate>
    <guid isPermaLink="false">https://archive.mroczna-zaloga.org/archives/1068-guid.html#c4484</guid>
    
</item>
<item>
    <title>p____h: Ciekawy(?) spam II</title>
    <link>https://archive.mroczna-zaloga.org/archives/1068-ciekawy-spam-ii.html#c4481</link>
            <category></category>
    
    <comments>https://archive.mroczna-zaloga.org/archives/1068-ciekawy-spam-ii.html#comments</comments>
    <wfw:comment>https://archive.mroczna-zaloga.org/wfwcomment.php?cid=1068</wfw:comment>

    

    <author>nospam@example.com (p____h)</author>
    <content:encoded>
    To, że pojawiło się &quot;tylko&quot; 5 linków nie jest niczym dziwnym – wiele systemów antyspamowych klasyfikuje daną wiadomość już po samej liczbie odnośników.

Co do pomysłu sprawdzania gramatyki i ortografii, to myślę, że byłby to nie tyle system antyspamowy, co system badający jakość komentarzy ;&gt;. Wiele firm stawia na ilość (bo gdzie więcej użytkowników, tym większy przepływ pieniędzy), a to znaczy, że oznaczanie jako potencjalny spam komentarzy, które są gramatycznie i ortograficznie niepoprawne raczej ich nie zadowoli (a przykładów na to, ile ludzi w Sieci pisze tak, jakby nigdy nie mieli styczności ze słownikiem, chyba podawać nie trzeba).
Natomiast sprawdzanie &quot;prawdopodobieństwa wystąpienia w prawidłowym tekście określonych fraz&quot; i fleksji wydają się ciekawe. Chociaż odnośnie tego pierwszego bardziej skłonny byłbym pójść raczej w kierunku badania szyku zdania. Zwłaszcza, że analizę szyku zdania dałoby się rozszerzyć również dla innych języków.

Jest tylko jedno &quot;ale&quot;. Bardzo dokładna analiza komentarzy spowoduje, że spambotom nie będzie opłacało się generowanie tekstu. Będą go po prostu pobierały z już istniejących stron (zresztą, zastanawiam się, dlaczego już teraz tego nie robią – a przynajmniej nie robią na masową skalę). Algorytm byłby stosunkowo prosty. Pobieranie ze strony, (którą chcą zaspamować) słów ustawionych w meta keywords, czy też nawet tagów wpisów. Następnie wyszukiwanie (chociażby za pomocą Google) podobnych tematycznie stron (keywords i tagi mają). Następnie z wyszukanych stron pobranie po kilka zdań i sklejenie ich w całość (co daje unikalny tekst, a także omija większości potencjalnych filtrów badających fleksję, gramatykę, czy też szyk zdania). Mało tego, nawet gdyby udało się stworzyć filtr badający kontekst, to i tak takim botom udałoby się go ominąć.  
    </content:encoded>

    <pubDate>Sat, 05 Nov 2011 22:06:49 +0100</pubDate>
    <guid isPermaLink="false">https://archive.mroczna-zaloga.org/archives/1068-guid.html#c4481</guid>
    
</item>

</channel>
</rss>