Python
取り込みの業務ででEmbulkを使っていると(個人的にsqoopよりembulk派)思わぬところでつまづく時がある。 mysql pulginとparquet用のプラグインを組み合わせて利用している(orcも)。 MysqlのtmpSpaceがたりない。 洗い替えのパターンなどで、大量のデータを…
取り込みの業務ででEmbulkを使っていると(個人的にsqoopよりembulk派)思わぬところでつまづく時がある。 mysql pulginとparquet用のプラグインを組み合わせて利用している(orcも)。 MysqlのtmpSpaceがたりない。 洗い替えのパターンなどで、大量のデータを…