<strike id="6q0um"></strike>
  • <strike id="6q0um"><s id="6q0um"></s></strike>
  • <ul id="6q0um"></ul><strike id="6q0um"></strike>

    當前位置:高考升學網 > 筆試面試 > 正文

    百度筆試面試經驗(二)

    更新:2023-09-18 08:44:24 高考升學網

      (3)改進

      策略選擇最是重要,可以采用統計學習的方法改進。

      4 題

      (1)思路:用哈希做

      (2) 首先逐次讀入查詢串,算哈希值,保存在內存數組中,同時統計頻度(注意值與日志項對應關系) my.chinahrlab.com 選出前十的頻度,取出對應的日志串,簡單不過了。哈希的設計是關鍵。

      5 題

      (1)思路:先將集合按照大小排列后,優先考慮小的集合是否與大的集合有交集。有就合并,如果小集合與所有其他集合都沒有交集,則獨立。獨立的集合在下一輪的比較中不用考慮。這樣就可以盡量減少字符串的比較次數。當所有集合都獨立的時候,就終止。

      (2)處理流程:

      1.將集合按照大小排序,組成集合合并待處理列表

      2.選擇最小的集合,找出與之有交集的集合,如果有,合并之;如果無,則與其它集合是獨立集合,從待處理列表 中刪除。

      3.重復直到待處理列表為空

      算法:1。將集合按照大小從小到大排序,組成待處理的集合列表。 2。取出待處理集合列表中最小的集合,對于集合的每個元素,依次在其他集合中搜索是否有此元素存在:

      1>若存在,則將此小集合與大集合合并,并根據大小插入對應的位置 。轉3。

      2>若不存在,則在該集合中取下一個元素。如果無下一個元素,即所有元素都不存在于其他集合。則表明此集合獨立,從待處理集合列表中刪除。并加入結果集合列表。轉3。

      3。如果待處理集合列表不為空,轉2。

      如果待處理集合列表為空,成功退出,則結果集合列表就是最終的輸出。

      算法復雜度分析:

      假設集合的個數為n,最大的集合元素為m 排序的時間復雜度可以達到nlog(n) 然后對于元素在其他集合中查找,最壞情況下為(n-1)m 查找一個集合是否與其他集合有交集的最壞情況是mm(n-1) 合并的時間復雜度不會超過查找集合有交集的最壞情況。所以最終最壞時間復雜度為O(mmnn)

      需要說明的是:此算法的均時間復雜度會很低,因為無論是查找還是合并,都是處于最壞情況的概率很小,而且排序后優先用最小集合作為判斷是否獨立的對象,優先與最大的集合進行比較,這些都最大的回避了最壞情況。

      (3)可能的改進:

      首先可以實現將每個集合里面的字符串按照字典序進行排列,這樣就可以將查找以及合并的效率增高。另外,可能采取恰當的數據結構也可以將查找以及合并等操作的效率得到提高。

      1)此題10分

      對任意輸入的正整數N,編寫C程序求N!的尾部連續0的個數,并指出計算復雜度。如:18!=6402373705728000,尾部連續0的個數是3。   (不用考慮數值超出計算機整數界限的問題)

      2)此題10分   編寫一個C語言函數,要求輸入一個url,輸出該url是首頁、目錄頁或者其他url

      如下形式叫做首頁:

      militia.info/

      www.apcnc.com.cn/

      http://www.cyjzs.comwww.greena888.com/

      www.800cool.net/

      http://hgh-products.my-age.net/

      如下形式叫做目錄頁:

      thursdaythree.net/greenhouses--gas-global-green-house-warming/

      http://www.mw.net.tw/user/tgk5ar1r/profile/

      http://www.szeasy.com/food/yszt/chunjie/

      www.fuckingjapanese.com/Reality/

      請注意:

      a) url有可能帶http頭也有可能不帶

      b)動態url(即含有"?"的url)的一律不算目錄頁,如:

      www.buddhismcity.net/utility/mailit.php?l=/activity/details/3135/

      www.buddhismcity.net/utility/mailit.php?l=/activity/details/2449/

      另:如果你會linux,請用linux下的grep命令實現第2題的功能(附加5分)。

      3)此題40分

      如果必須從網頁中區分出一部分"重要網頁"(例如在10億中選8億),比其他網頁更值得展現給用戶,請提出一種方案。

      4)此題40分

      假設有10億網頁已經被我們存下來,并提供如下信息:網頁全文(即網頁的源碼)、全文長度、網頁正文(即網頁中提取的主體文字)、正文長度,以及其他網頁提取物等,現在希望去掉其中的重復網頁,請提出可行的方案,計算出每個網頁對應的重復度,你可以自己對網頁重復下定義,也可以提出需要哪些更多的網頁提取物來實現更好的去重復方案。

    閱讀了本文,本站還為你提供以下更多相關文章:

    DHL筆試經驗

    百度產品類筆試經驗

    奇虎360筆試(產品類)經驗

    最新圖文

    常見的hr面試官面試問題大全

    時間:2023-09-14 23:0:24

    企業面試官面試的問題有哪些

    時間:2023-09-15 17:0:48

    企業面試官面試問題及參考

    時間:2023-09-17 08:0:27

    高校教師招聘面試答辯100題

    時間:2023-09-17 06:0:03
    亚洲久悠悠色悠在线播放| 亚洲国产aⅴ成人精品无吗| 亚洲另类精品xxxx人妖| gogo全球高清大胆亚洲| 亚洲人成免费网站| 好看的亚洲黄色经典| 毛片亚洲AV无码精品国产午夜| 亚洲av无码片区一区二区三区| 亚洲成年人免费网站| 好看的亚洲黄色经典| 国产l精品国产亚洲区在线观看| 国产亚洲人成无码网在线观看| 亚洲福利精品一区二区三区| 在线aⅴ亚洲中文字幕| 亚洲资源在线视频| 国产亚洲av片在线观看16女人| 中文字幕亚洲电影| 亚洲高清偷拍一区二区三区 | 亚洲色图黄色小说| 亚洲欧洲国产精品香蕉网| 国产亚洲精AA在线观看SEE| 人人狠狠综合久久亚洲婷婷| 亚洲国产精品一区| 亚洲精品无码不卡在线播HE | 亚洲精品无码高潮喷水A片软| 亚洲国产成人精品无码区花野真一 | 亚洲欧好州第一的日产suv| 亚洲剧场午夜在线观看| 77777亚洲午夜久久多喷| 亚洲日本在线播放| 国产日本亚洲一区二区三区| 亚洲精品国产精品| 大胆亚洲人体视频| 亚洲精品色午夜无码专区日韩| 亚洲AV无码专区国产乱码电影| 国产精品国产亚洲精品看不卡| 久久精品亚洲精品国产色婷| 亚洲爱情岛论坛永久| 亚洲AV无码久久精品成人| 久久亚洲精品成人AV| 亚洲香蕉在线观看|