was successfully added to your cart.

hive-0.9.0 다운로드

By May 12, 2019 Uncategorized No Comments

이 자습서에서는 hive-0.14.0를 사용 합니다. 다음 링크 http://apache.petsads.us/hive/hive-0.14.0/를 방문 하 여 다운로드할 수 있습니다. 우리가/다운로드 디렉토리에 다운로드 되는 가정 하자. 여기서는이 튜토리얼에서 “apache-hive-0.14.0” 라는 하이브 아카이브를 다운로드 합니다. 다음 명령은 다운로드를 확인 하는 데 사용 됩니다. 시스템에 Hive를 설치 하려면 다음 단계가 필요 합니다. Hive 아카이브가/Pas 디렉토리에 다운로드 되었다고 가정해 봅시다. 일반적으로 다운로드 폴더에서 다운로드 한 java 파일을 찾을 수 있습니다. 확인 하 고 다음 명령을 사용 하 여 jdk-7u71-linux-x64 파일을 추출 합니다. 이유 2: 조인을 위한 맵 조인 벡터화 향상 많은 MapJoin 최적화가 Hive 2로 전환 되었습니다.

예를 들어, 작은 차원 테이블에 대 한 조인은 이제 명시적으로 확장 된 목록 만큼 빠르게 실행 됩니다. Hive를 실행 하기 전에 HDFS에서/tmp 폴더와 별도의 Hive 폴더를 생성 해야 합니다. 여기서는/user/hive/웨어하우스 폴더를 사용 합니다. 아래와 같이 이러한 새로 만든 된 폴더에 대 한 쓰기 권한을 설정 해야 합니다. Hive, Pig 및 HBase와 같은 모든 Hadoop 하위 프로젝트는 Linux 운영 체제를 지원 합니다. 따라서, 어떤 리눅스 맛 있는 운영 체제를 설치 해야. Hive 설치에 대해 다음과 같은 간단한 단계가 실행 됩니다 .이 도움이 되는 위치에 대 한 좋은 예는 쿼리 43, 저장소 차원 조인에서 37% 선택도 있습니다. 팩트 테이블에서 반복 되는 시퀀스를 활용 하는 더 나은 MapJoin 벡터화를 사용 하면 쿼리 43을 195.2 s에서 4.2 s까지 수행할 수 있습니다. 언제나 처럼, 아파치 하이브는 100% 오픈 소스와 당신의 선택의 하 둡 배포판에 사용할 수 있습니다., 그리고 그 블로그에서 설명 하는 모든 다른 기능 뿐만 아니라 성능 향상을 위해 간다. 이제 위에서 설명한 대로 터미널에서 명령 자바 버전을 사용 하 여 설치를 확인 합니다.

PATH 및 JAVA_HOME 변수를 설정 하려면 ~/.bashrc 파일에 다음 명령을 추가 합니다. 이러한 성능 향상에 대 한 주요 이유 중 일부를 살펴보겠습니다. 이후 게시물에서 이러한 다른 항목을 살펴보겠습니다. 지금은 Hive 2의 가장 기대 되는 기능과 잠금 해제 하는 엄청난 성능 향상에 중점을 둘 것입니다. 더비 설치 및 환경 설정이 완료 되었습니다. 하 둡에 액세스 하는 기본 포트 번호는 50070입니다. 다음 url을 사용 하 여 브라우저에서 Hadoop 서비스를 받으십시오. 위에 나열 된 Hadoop 프로젝트 외에도 몇 가지 고유한 제품을 다음을 포함 하 여 데이터 플랫폼에 번들 하 고 긴밀 하 게 통합 했습니다. 유익한 블로그 감사 합니다. Hive 2.1는 확실히 더 유망한 보인다. 산 지원도 풍부 하 게 희망 합니다. 덕분에 전체 테스트 환경은 아래에서 살펴볼 수 있지만 높은 수준에서 테스트는 BI 도구와 함께 일반적으로 사용 되는 데이터 확장에서 성능을 보여주기 위한 1TB 데이터 집합을 포함 하는 10 개의 강력한 Vm을 사용 하 여 실행 됩니다.

Hive 1 및 Hive 2에 대해 동일한 Vm 및 동일한 데이터가 모두 사용 됩니다. 보고 된 모든 시간은 각각의 Hive 버전에서 3 번의 실행에 걸친 평균을 나타냅니다. . 아파치 Hive 2.1는 약 한 달 전에 출시 되었으며 Hive 2가 하 둡에서 SQL의 풍경을 크게 변경 하는 방법을 검토할 수 있는 좋은 기회입니다. Hive에서 너무 많은 새로운 것은 하이라이트를 선택 하는 것이 어렵지만 여기에는 몇 가지가 있습니다: Hortonworks 데이터 플랫폼의 버전 1.0 아파치 하 둡-1.0.3, 아파치 하 둡 커뮤니티에 의해 정의 된 하 둡의 최신 안정 라인을 포함 한다. 핵심 하 둡 구성 요소 (맵 리 듀 스 및 HDFS 포함) 외에도 HBase 0.92.1, 하이브 0.9.0, 돼지 0.9.2, Sqoop 1.4.1, Oozie 3.1.3 및 사육 사 3.3.4를 포함 하 여 필수 프로젝트의 최신 안정 된 릴리스를 포함 했습니다. 모든 구성 요소는 함께 작동 하도록 테스트 되 고 인증 되었습니다. 우리는 또한 아파치 하 둡 시작의 경험을 향상 시키기 위해 설치 및 구성 단계를 단순화 하는 도구를 추가 했습니다.

이유 3: 완전히 벡터화 된 파이프라인 하이브 2는 동적으로 분할 된 해시 조인을 사용 하 여 감소 측면에서 맵 조인 벡터화를 도입 하며 본질적으로 MapJoin 최적화의 축소 쪽 버전입니다. 이 최적화를 사용 하 여 감속 기 입력을 정렬 하 고 감소 측면에 유지 되는 해시 테이블을 통해 스트리밍됩니다.