Failed to load JavaHL Library.
These are the errors that were encountered:
no libsvnjavahl-1 in java.library.path
no svnjavahl-1 in java.library.path
no svnjavahl in java.library.path
java.library.path = /usr/lib/jvm/java-6-sun-1.6.0.03/jre/lib/i386/client::/
usr/lib/jvm/java-6-sun-1.6.0.03/jre/lib/i386::/usr/lib/firefox:/usr/lib/
firefox/:/usr/java/packages/lib/i386:/lib:/usr/lib

이런 에러가 나와서 구글링을 해봤더니 아래와 같은 해결책이 나왔다.

 

Install libsvn-java

The Debian/Ubuntu package libsvn-java has the libsvnjavahl-1.so file that is required by JavaHL subversion interface. Install libsvn-java by typing the following into a command line:

sudo  apt-get install libsvn-java

Restart Eclipse.

After installation is complete the required file (libsvnjavahl-1.so) is installed into the /usr/lib/jni directory. Default installations of Eclipse will pick this directory up automatically. Non-standard installation, such as ones installed by hand, will not find the required file.


출처 : http://islandlinux.org/howto/installing-javahl-subclipseeclipse-ubuntu


http://kusearch.cygn.net

여러모로 아쉬움이 많은 프로젝트...

게시판 댓글 검색엔진. 가용머신이 공용서버 한 대인 관계로 크롤링 규모를 크게 잡지 못했다.

현재는 학기중인데다가, 다른 프로젝트를 하고 있어서 잠시 개발을 중단했지만 여름방학 즈음에는 다시 시작할 예정이다.

크롤링 대상은 고파스 (http://koreapas.net)의 공개된 게시판.

1. 구성원 소개
 이경찬(cygn) : 크롤러, 인덱서 제작
 김지우 : 검색 페이지 제작

2. 개요
 사용 언어 : Python

 사용 라이브러리 : BeautifulSoup, Whoosh
     - BeautifulSoup : Html 파싱 라이브러리
     - Whoosh : 인덱싱 라이브러리

 사용한 웹 프레임워크 : Django Framework

 동작 방식
     - Crawler가 게시판 인식후 댓글 크롤링
     - Indexer 가 크롤링된 자료 인덱스 생성

정규표현식 문법

Python 2010/01/05 20:42
 . 모든문자
 ^  문자열의 시작
 $ 문자열의
 * 반복되지 않거나 반복
 + 한번 이상 반복
 ? 반복되지 않거나 한 번 반복
 | A|B는 A이거나 B
 [a-z]  영문 소문자 하나
 \w 영문, 숫자 혹은 밑줄(_) 하나
 \d 숫자 하나나

Iterator

Python 2009/11/18 09:00
for element in [1, 2, 3]:
     print(element)

for char in "123":
     print(char)

for line in open("myfile.txt"):
     print(line)


for는 순회 가능한 객체(리스트, 튜플, 문자열)에서 이터레이터 객체를 가져옴

이터레이터는 순회 가능한 객체의 요소를 순서대로 접근할 수 있는 객체

for 구문은 이터레이터 안의 __next__() 메서드를 실행

__next__()는 현재 이터레이터가 가리키고 있는 객체의 요소를 리턴하고 객체의 다음 요소를 가리킴


s = 'abc'
it = iter(s)

next (it) --> 'a'
next (it) --> 'b'
it.__next__(it) --> 'c'



g = 1
def testScope(a):
      global g
      g = 2
      return g + a