Íomhá:Graphique Zipf pour Ulysses.png

Graphique_Zipf_pour_Ulysses.png (640 × 480 picteilín, méid comhaid: 4 KB, cineál MIME: image/png)

Seo comhad as An Cómhaoin Viciméid. Tá an tuairisc as an leathanach tuairisc Cómhaoin a leanas thíos.
Is stór comhaid meáin Saor é an Cómhaoin Viciméid. Is féidir leat cabhrú.

Achoimriú

Tuairisc
English: log/log graph of rank/frequency of words in "Ulysses" by James Joyce (Zipf Law)
Français : graphique log/log de la fréquence des mots par leur rang dans "Ulysses" de James Joyce (Loi de Zipf)
Dáta
Foinse Obair féin
Údar User: Xofc

Method

Using "Ulysses" by James Joyce found on http://www.gutenberg.org/etext/4300

PERL code:

#!/usr/bin/perl
while ($line = <STDIN>)
        {
        $line =~ tr/[A-Z]/[a-z]/;
        @WORDS_IN_LINE = split /\W+/, $line;
        for (@WORDS_IN_LINE)
                {
                $word_freq{$_}++
                }
        }
sub numeriquement { $b <=> $a; }
foreach $freq (sort numeriquement values %word_freq)
        {
        printf("%-5d %d\n", $i++, $freq);
        }

Or 'bash' code :

cat 4300-8.txt
|tr [A-Z] [a-z]|sed 's/[^a-z]/\n/g'|awk '/[a-z]/{print $1;}'|sort|uniq -c|awk '{print $1;}'|sort -rn|pr -n -t
# |tr "[A-Z]" "[a-z]"            # convert to lower cases
# |sed 's/[^a-z]/\n/g'       # one word per line : convert every non alpha by carriage_return
# |awk '/[a-z]/{print $1;}'  # forget empty lines
# |sort|uniq -c              # sort and count
# |awk '{print $1;}'         # just remember the count (forget the word)
# |sort -rn                  # sort numerically, descending order
# |pr -n -t                  # put a line number (=rank)
 
This plot was created with Gnuplot by n.

Ceadúnú

Is mise sealbhóir cóipchirt an shaothair seo agus foilsím é faoi na ceadúnais seo a leanas:
GNU head Tugtar cead an doiciméad seo a chóipeáil, a dháileadh agus/nó a mhodhnú faoi théarmaí an Ceadúnas Doiciméadúcháin Saor ó GNU, Leagan 1.2 nó aon leagan níos déanaí a d’fhoilsigh an Fondúireacht Bogearraí Saor in Aisce; gan aon Rannóga Inmheánacha, gan aon Téacsanna Clúdaigh Tosaigh, agus gan aon Téacsanna Clúdaigh Cúil. Tá cóip den cheadúnas san áireamh sa chuid dar teideal Ceadúnas Doiciméadúcháin Saor ó GNU.
w:ga:Creative Commons
sannadh comhroinn araon
This file is licensed under the Creative Commons Attribution-Share Alike 4.0 International, 3.0 Unported, 2.5 Generic, 2.0 Generic and 1.0 Generic license.
Is féidir:
  • an saothar seo a roinnt – an saothar seo a chóipeáil, a dháil amach, agus a tharchur
  • an saothar seo a athmheascadh – an saothar seo a oiriúnú
Ach amháin má leantar na coinníollacha seo a leanas:
  • sannadh – Ní mor creidiúint a thabhairt leis an saothar, faoi mar a shonraigh an údar nó tabharthóir an ceadúnais (ach ná húsáid modh a thugann le fios go thacaíonn sé/sí tú féin nó an úsáid a bhaineann tú as an saothar).
  • comhroinn araon – Má athraíonn tú nó síneann tú amach an saothar seo, ní féidir é a dháileadh ach amhaín faoin gceadúnas céanna nó ceann cosúil leis an gceann seo.
Is féidir leat a roghnú an ceadúnas do rogha

Captions

Add a one-line explanation of what this file represents

Items portrayed in this file

taispeánann sé/sí

4 Deireadh Fómhair 2009

Stair chomhaid

Cliceáil ar dáta/am chun an comhad a radharc mar a bhí sé ag an am sin.

Dáta/AmMionsamhailToisíÚsáideoirNóta tráchta
faoi láthair17:11, 4 Deireadh Fómhair 2009Mionsamhail do leagan ó 17:11, 4 Deireadh Fómhair 2009640 × 480 (4 KB)Xofc{{Information |Description={{en|1=log/log graph of rank/frequency of words in "Ulysses" by James Joyce (Zipf Law)}} {{fr|1=graphique log/log de la fréquence des mots par leur rang dans "Ulysses" de James Joyce (Loi de Zipf)}} |Source=Own work by uploader

Tá nasc chuig an gcomhad seo ar na leathanaigh seo a leanas:

Global file usage

Úsáidtear an comhad seo ar na vicithe seo a leanas: