196 文字
1 分
コマンドラインで集合演算
Retention Rateの計算ってめんどくさいですよね。
自分でプログラム書いてもいいけど、メモリ食うからちゃんと書かないといけないから、長くなっちゃうし。
Map Reduce使えばすぐだけど、そんなの手元にない場合が多いよね。
でも、手元にある大量のレコードがあるCSVファイルなどを簡単に集計したいときににコマンドによる処理が便利です。
前提
A={1,2,3}
B={3,4,5}
A∩B
積集合。AとB両方にある。
% cat A B | sort | uniq -d3A∪B
和集合。AかBに含まれる。
% cat A B | sort | uniq12345A∪B - A∩B
排他。AまたはBに存在する。
% cat A B | sort | uniq -u1245 コマンドラインで集合演算
https://blog.teraren.com/posts/element-calculation/