User Tools

Site Tools


study:data_analysis:cascalog

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
study:data_analysis:cascalog [2013/09/14 12:58]
psk810
study:data_analysis:cascalog [2019/02/04 14:26] (current)
Line 284: Line 284:
   * **발생기(Generators)** : 질의에서 기본이 되는 데이타 집합. 클로져의 벡터나 CVS, TSV 파일등.   * **발생기(Generators)** : 질의에서 기본이 되는 데이타 집합. 클로져의 벡터나 CVS, TSV 파일등.
   * **연산(Operations)** : 외부에서 정의된 입력 변수를 받아 필터링하거나 새로운 변수에 바인딩하는 함수.   * **연산(Operations)** : 외부에서 정의된 입력 변수를 받아 필터링하거나 새로운 변수에 바인딩하는 함수.
-  * **종합자(Aggregators)** : Count, sum, min, max 등.+  * **집계기(Aggregators)** : Count, sum, min, max 등.
  
 프레디키트(predicate)는 이름, 입력 변수 리스트, 그리고 출력 변수 리스트를 갖는다. 프레디키트(predicate)는 이름, 입력 변수 리스트, 그리고 출력 변수 리스트를 갖는다.
  
-:> 는 프레디키트(predicate) 연산자인데,​ 입력 변수와 출력 변수를 나누는 역할을 한다. 만일 생략되면 변수는 프레디키트(predicate)가 연산일 경우에는 입력 변수로, 발생기나 ​종합자일 경우에는 출력 변수가 된다.+:> 는 프레디키트(predicate) 연산자인데,​ 입력 변수와 출력 변수를 나누는 역할을 한다. 만일 생략되면 변수는 프레디키트(predicate)가 연산일 경우에는 입력 변수로, 발생기나 ​집계기일 경우에는 출력 변수가 된다.
  
 <code clojure> <code clojure>
Line 420: Line 420:
   * deffilterop : 필터링 연산을 정의할 때 사용하는 것으로 불린값을 출력한다.   * deffilterop : 필터링 연산을 정의할 때 사용하는 것으로 불린값을 출력한다.
   * defmapop ​   : 단일 튜플을 출력한다.   * defmapop ​   : 단일 튜플을 출력한다.
-  * defaggregateop : 종합자를 정의한다.+  * defaggregateop : 집계기를 정의한다.
  
 하지만 보통의 클로져 함수도 연산으로 사용될 수 있다. 하지만 보통의 클로져 함수도 연산으로 사용될 수 있다.
Line 482: Line 482:
  
  
-이제 여기서 각 사람에 대해서 follow관계의 수를 세어보자. 보통의 "​count" ​종합자(aggregator)는 여기서는 문제가 되는데 왜냐하면 그것은 모든 것을 다 세기 때문이다. null이든 non-null이든! +이제 여기서 각 사람에 대해서 follow관계의 수를 세어보자. 보통의 "​count" ​집계기(aggregator)는 여기서는 문제가 되는데 왜냐하면 그것은 모든 것을 다 세기 때문이다. null이든 non-null이든! 
-여기서는 follow 관계가 없으면 0, 있으면 1로 세어야 한다. Cascalog는 이것을 위해 !count ​종합자를 마련하고 있다.+여기서는 follow 관계가 없으면 0, 있으면 1로 세어야 한다. Cascalog는 이것을 위해 !count ​집계기를 마련하고 있다.
  
 <code clojure> <code clojure>
Line 494: Line 494:
  
  
-===== 결합자(Conbiners)와 병행 ​종합자(Parallel Aggregators) =====+===== 결합자(Conbiners)와 병행 ​집계기(Parallel Aggregators) =====
  
 ===== 정렬(Sorting) ===== ===== 정렬(Sorting) =====
study/data_analysis/cascalog.txt · Last modified: 2019/02/04 14:26 (external edit)