阿里巴巴集團筆試題目

才智咖 人氣:1.66W

下面是由本站分享的筆試題目

阿里巴巴集團筆試題目

第一題、5億個不重複的商品的ID(每一個商品的ID是64位),現在有一個存放了10億個商品ID(商品的ID會有重複)的日誌檔案,請設計一種方法找出5億個商品中沒有出現在日誌檔案中的商品。假設所能使用的記憶體為2G。
[html] view plaincopyprint?
01.2G的`檔案只能存放2.5億的商品ID,因為5億商品大小為5*10^8*8B=4G。可以考慮將5億商品ID雜湊到四個檔案中A[4]。然後將10億個商品雜湊到另外四個檔案中B[4]。每次讀入一個A檔案讀入一個B檔案,將B檔案雜湊到A檔案中,A檔案中的值為0的鍵值就是沒有被日誌檔案包含的。但是日誌檔案分成四個之後,每一個的大小事2G無法一次性的讀入,可以一次讀一半或者分成8個檔案。以上為博主的思路,歡迎各位指正。
2G的檔案只能存放2.5億的商品ID,因為5億商品大小為5*10^8*8B=4G。可以考慮將5億商品ID雜湊到四個檔案中A[4]。然後將10億個商品雜湊到另外四個檔案中B[4]。每次讀入一個A檔案讀入一個B檔案,將B檔案雜湊到A檔案中,A檔案中的值為0的鍵值就是沒有被日誌檔案包含的。但是日誌檔案分成四個之後,每一個的大小事2G無法一次性的讀入,可以一次讀一半或者分成8個檔案。以上為博主的思路,歡迎各位指正。[cpp] view plaincopyprint?
01.

第二題、有一個片語的列表,list<string> wordlist={"a boy","hello word ","small cat",.......};有一個字串string stringlist={“ a boy can catch small cats”}.

要求找出出現在stringlist中的wordlist的片語。比如a boy就出現了,但是small cat沒出現。只要有一個出現了就返回true,否則返回false

[cpp] view plaincopyprint?
01. bool Find(list<string>wordlist,string stringlist)
02.{
03. int length=th();
04. int i;
05. for(i=0;i<length;i++)
06. {
07. if((wordlist[i])!=()&&*((wordlist[i])++)==' ')
08. {
09. return true;