Python
Ubuntu makinemin üzerine python kurdum ve terminal den “nltk.download('brown')
” komutunu çalıştırınca
Error: (on ubuntu)
raise HTTPError(req.get_full_url(), code, msg, hdrs, fp) HTTPError: HTTP Error 404: Not Found
hatası almaktayım bu sorunu nasıl çözebilirim?
Bu komut terminal ekarınında çalışmaz bunun için önce terminalde “python” yazarak önce python platformunu çalıştır sonra bu komutu çalıştır. Eğer hala aynı hatayı alıyorsan nltk’nın (ubuntu için) python kütüphanelerinin saklandığı yerdeki ( /usr/lib/python2.7) kütüphane klasörü altında yer alan “downloader.py” dosyadaki “DEFAULT_URL” değiştirmemiz gerekiyor. bunu ister manuel olarak ister isen terminalden yapabilirsin.
Manuel olarak:
$sudo nano /usr/lib/python2.7/dist-packages/nltk/downloader.py
dosyayı açtıktan sonra "DEFAULT_URL" yazan yeri bul büyük ihtimal ile orada
DEFAULT_URL = 'http://nltk.googlecode.com/svn/trunk/nltk_data/index.xml'
ama bu doğru bir servis değil, bunun yerine;
DEFAULT_URL = "http://nltk.github.com/nltk_data/"
şeklinde değiştirmelisin.
Otomatik:
$sudo perl -pi -e 's#DEFAULT_URL = .*#DEFAULT_URL = "http://nltk.github.com/nltk_data/"#' /usr/lib/python2.7/dist-packages/nltk/downloader.py
komutunu terminalden çalıştırarak da bu işlemi yapabilirsin. ayrıca nltk’nın tüm dosyalarını terminalden yünkemek için ;
$ python -m nltk.downloader all
komutunuda çalıştırabilirsin.
bu işlemler bittikten sonra terminalden “python” komutunu çalıştırarak;
$ python
yaptığımız işlemi kontrol edebilirizi.
Python 2.7.6 (default, Mar 22 2014, 22:59:56)
[GCC 4.8.2] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import nltk
>>> nltk.download('brown')
[nltk_data] Downloading package 'brown' to /home/sylvain/nltk_data...
[nltk_data] Unzipping corpora/brown.zip.
True
>>> from nltk.corpus import brown
>>> brown.words()
['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', ...]
Kaynak:
http://askubuntu.com/questions/527388/python-nltk-on-ubuntu-12-04-lts-nltk-downloadbrown-results-in-html-error-40