Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Add Swedish stopwords #195

Merged
merged 3 commits into from
Nov 10, 2023
Merged
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension


Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
1 change: 1 addition & 0 deletions setup.py
Original file line number Diff line number Diff line change
Expand Up @@ -88,6 +88,7 @@
"Natural Language :: Portuguese",
"Natural Language :: Slovak",
"Natural Language :: Spanish",
"Natural Language :: Swedish",
"Natural Language :: Ukrainian",
"Natural Language :: Greek",
"Natural Language :: Arabic",
Expand Down
285 changes: 285 additions & 0 deletions sumy/data/stopwords/swedish.txt
Original file line number Diff line number Diff line change
@@ -0,0 +1,285 @@
alltså
att
av
bakom
bara
bland
blev
bli
blir
blivit
båda
bådas
både
de
del
delen
dem
den
denna
deras
dess
dessa
det
detta
dig
din
dina
dit
ditt
dock
dom
du
där
därför
efter
eftersom
elfte
eller
elva
en
enkel
enkelt
enkla
enligt
er
era
ert
ett
fall
fanns
fast
fick
fin
finnas
finns
fler
flera
flesta
fram
framför
från
får
fått
följande
för
före
förra
första
ge
genast
genom
ger
gick
gjorde
gjort
gälla
gäller
gällt
gång
går
gått
gör
göra
ha
hade
haft
han
hans
har
hela
heller
hellre
helst
helt
henne
hennes
heter
hit
hon
honom
hur
här
i
ibland
idag
igen
igår
imorgon
in
inför
inga
innan
inne
inom
inte
inuti
ja
jag
jämfört
kan
kanske
knappast
kolla
kom
komma
kommer
kommit
kunde
kunna
kunnat
kvar
kör
legat
ligga
ligger
lilla
lite
liten
litet
lägga
länge
längre
längst
lätt
lättare
lättast
långsam
långsammare
långsammast
långsamt
långt
man
med
mellan
men
menar
mer
mera
mest
mig
min
mina
mindre
minst
mitt
mittemot
mot
mycket
många
måste
möjlig
möjligen
möjligt
möjligtvis
ned
nederst
nedersta
nedre
nej
ner
ni
nog
nr
nu
när
nästa
någon
någonting
något
några
nån
nåt
och
också
ofta
oftast
olika
olikt
om
oss
rakt
redan
rätt
sade
sagt
samma
samt
sedan
sen
ser
senare
senast
sent
sig
sin
sina
sist
sista
siste
sitt
ska
skall
skriver
skulle
slutligen
små
smått
snart
som
stor
stora
stort
står
säga
säger
sätt
ta
tar
till
tills
tog
under
upp
ur
ut
utan
ute
vad
var
vara
varför
varifrån
varit
varje
varken
vart
vem
vems
vet
vi
vid
vidare
vilka
vilken
vilket
vill
visst
väl
värre
vår
våra
vårt
än
ändå
ännu
är
även
åtminstone
över
övermorgon
5 changes: 5 additions & 0 deletions tests/test_stemmers.py
Original file line number Diff line number Diff line change
Expand Up @@ -51,3 +51,8 @@ def test_greek_stemmer():
# The first assert covers the empty stem case.
assert "οτ" == greek_stemmer("όταν")
assert "εργαζ" == greek_stemmer("εργαζόμενος")


def test_swedish_stemmer():
swedish_stemmer = Stemmer("swedish")
assert "sov" == swedish_stemmer("sover")
Loading