索引史
Dennis Duncan《索引,知識的鑰匙》(Index, A History of the: A Bookish Adventure),台北﹕商周,2023
顧名思義,就是講「索引」的歷史囉。索引即是學術類書籍末尾出現一堆跟字母排列(中文有時按筆劃),告知相關內容在書中哪幾頁的列表。似乎只有圖書館員或者學者才有興趣﹖(笑)
正如本書推介本身所示,索引看似學究和遙遠,實質與所有人密切相關。尤其現今網絡世界,早有yahoo後有google,實質都是一種(網頁的)索引。
在未有索引的時代,書裡所有的內容都要背下來。所以古人所謂「學富五車」者,往往同時也是「過目不忘」。要不然想從一堆竹簡或者莎草紙卷中找回原文,實在費時失事。所以不止是識字讀書的機會少,要掌握好學問的難度就更高。
(後話﹕其實在竹簡時代,一部書要用很多竹簡,甚至分很多卷才完成。堆滿五架牛車可能也不及今日用五架購物車裝的書內容多。當然那個年代的書也沒多少就是了,所以能有五架牛車的書當然很厲害。)
而作者說得清楚,竹簡或莎草紙卷這類「卷」形書要發展出索引還是很難的﹕
#85 「由此不難想見為何索引屬於翻頁書時代而不適合卷軸書時代:技術本身具有隨機存取(random-access)的性質,只有能夠快速輕巧在前中後任何位置進行切換的書本結構才與其相容。翻頁書是歷史上第一個能讓索引發揮功用的資訊媒介。」
書卷的情況就跟使用磁帶儲存的設備,很難做到隨機存取,想找到特定位置也不容易。
但無論書籍形式,顯然不可能所有人都這樣把所有東西都背下來,尤其是帝王將相之類的大忙人。於是索引首先以「目錄」形式出現,先讓目標讀者知道內容結果,無需讀完整套書(往往分成多「卷」)才看到自己特別想讀的內容。而目錄或索引出現後,自然也方便到需要在大量文本中搜索文句的教士和學者。
正如書籍出現後,智者就開始擔心人們依賴書本而非自己的記憶和心智,會造成智力退步。索引出現後,同樣有人認為索引令學生不用讀完整本書,會造成零碎片面的理解。有沒有發現這種擔憂,跟我們現在看網絡對人的影響很相似﹖(多少學生只在google隨便打個問題,然後就把頭幾個結果抄下來交功課﹖)
(當然更甚者,我們更擔心短片視頻滿足短暫注意力的需要,令人們進一步沒耐性仔細思考。)
有趣的是,索引似乎是種「純屬西方」的發明。中國有類書,類似百科全書,某程度上也跟索引相似,把古代不同書籍的內容編纂一起分類排列,方便讀者查看。但中文古書似乎有類書、有目錄,而無索引。
原因可能是作者所言﹕索引首先要定個順序。西文書籍可以靠字母排序,漢字卻如《中文打字機》所云,沒有簡單的排列順序。《永樂大典》據聞按韻排列,字典多以部首和筆劃(還可以靠拼音和四角號碼)。可是同一韻同讀音的字、同一部首同筆劃的字該誰先誰後,卻沒有像字母排序那麼簡單的方法。當你那套書像永樂大典那麼宏偉,連目錄都有57冊,要弄索引只會更長。如果索引沒有簡單的排序方式,讀者根本連條目都找不到,遑論內容。
更好笑的是,不看本書不知道,索引原來不只學習才用得著。小說可以用索引方式製造疑團(索引本來就要斷裂內文,小說家正好利用這點設計一個「破碎」的故事)。索引條目既然不是把內文胡亂漫索,而要人工選取跟內容主旨相關的「合適」條目,即是有主觀成份,學者和政客竟然可以利用索引條目詆毀對手。
到最後,近世的知識和出版爆炸,迫使學人嘗試製作橫跨不同作品和領域的「泛用索引」,以《期刊索引》作結。最後編製索引工作由人手進入機械化,又開出今日的網絡搜索引擎。
一本小書,不見得能讓你完全了解索引的歷史,但簡單回顧一下索引的往事,仍是令人回味之旅。
(如果閣下有興趣讀電子書,經本文連結 https://moo.im/a/6adjwy 購買,本人將獲得平台回饋。當然看倌不一定要經這條連結買的。)
筆記,或挑骨頭﹕
#15 推薦序「編輯,除了編排文字的段落、篇章、校對文稿、下標題、製作目錄,有時還要費神編纂註釋,或在書末加上索引。這些經常被讀者忽略的細節,卻往往是作者做不來,編輯若不做就沒人做的苦差事。編輯能為一本書加分到超乎作者想像的程度,也難怪很多作者要心生感激,對編輯大聲道謝。」
以為註釋是作者或譯者做的呢。
#30 「索引也曾被有心人拿來做為惡搞對手的工具,特別是在著作權意識還不彰顯的時代。」
有如地圖故意植入錯誤一樣。
#50–76 前言「「索引」究竟是什麼?一般而言,它是一套標記目標位置以節省時間的系統。索引的英文(index)呈現出類似地圖的空間關係:「指示」(indicate)出想找的東西位於何處。……中世紀末期,register、table、rubric這幾個單詞同時能表示目錄與索引,導致一般人更難區隔兩者。」
倒沒想過這層關係。
#103 「主要探討字母排序的方式如何拆解書籍、條目,甚至特定字詞。索引技術作為書籍的附屬品,出發點是提升特定模式的閱讀速度,學者通常稱其為摘錄式閱讀(extract reading)」
其實百科全書本身就可以當成一套大索引。
#147 「一五四三年三月,亨利八世治下的教會派人搜索約翰.馬貝克(John Marbeck)的住家。……他被關進王室內務法庭監獄,正常來說小命難保。」
看不明是甚麼,星室法庭﹖網上說是Court of the Marshalsea的中譯,而事主似乎的確是在這受審和囚禁。
#354 第一章「首先教養良好的你得學會字母順序,要真的學通,才能在「不查書的前提下」記得順序。考德瑞對大眾「不諳語文」的想像實在驚人!現代人覺得理所當然,他卻得長篇大論加以說明:字母和字典之間存在對應的空間關係,詞彙首字母比較前面就會收錄在比較前面的位置。」
面對中文授課中學(CMI)學生多了你就會明白這並非本能,字母順序是學背的。
「這些案例再再說明字母排序原本並非直覺反應」
應為「在在說明」。
#487 「古跡上刻有祭祀阿波羅與海克力斯的信徒名字,還特別標註名單應該「從alpha開始照字母順序排列」」
古代版「排名不分先後」。
「現代人或許以為羅馬帝國幅員遼闊、階級縝密,字母排序必不可少,但事實並非如此。」
可能正因為階段嚴明所以排名「必」分先後,已以顯貴和重要性分先後,自然不需要再用其他方式。
#827 第二章「想不到有人能在經文間轉換得如此流暢靈巧。幾年後他回憶起那天演說,形容說「來回往復卻不離其道」,其妙舌慧心「以經典權威的滋養使口中開出花朵」」
有如中文之「舌燦蓮花」。
#865「實際上「格羅斯泰斯特」是姓氏,抑或是他展現才能後得到的尊稱,我們都無法肯定──原文Grosseteste可以拆解為Grosse tête,字面意義即「大頭」。」
古時庶民大概沒姓氏吧。
#1183 第三章「這個傳統保留至今,現代人的日常生活依舊以章節來記測閱讀進度。反觀現代索引幾乎棄章節於不顧,稍微瞭解篇章概念就會明白個中緣由。」
篇章沒有固定長短,其實無法方便搜索內容呀。(古代每一章的長短可能受制於材料和製作方法而不會差太遠﹖)
#1229 「為了使用者方便以及不同格式轉換時的連續性,電子書也可以加上頁碼,如此一來無論讀者怎麼更動顯示設定都能與實體版對照。不過沒人規定出版社得這樣做」
方某自從看電子書後就提倡這樣做比較好(留意我沒說要誰「規定」這樣做)。一來書末索引較易使用(索引都是寫頁碼,一個詞語通常對應多於一頁,無法單靠連結和錨定一對一處理),二來方便電子書讀者與實體書讀者交流。(正如在下寫書介有記錄#的數字,實體書讀者還是不知道在哪一頁的)
#1245 「以Kindle為例,每一百五十位元組(bytes)會下一個名為「loc#」的定位碼,好比切割內容後貼上數字標籤。「loc#」和頁碼一樣獨立於內容而強行插入,不考慮思緒是否連貫、語氣停頓是否合理,無論權威人士談話或者斜體縮排超連結的控制代碼,只要湊滿一百五十個位元組就必定被切斷,是相當無情的演算法。好處在於很精細,目標詞語的可能範圍小於一則推特貼文長度。」
這似乎只是出版社的規矩﹖Kindle可能強制規定了,可是讀墨買到的書似乎沒有。有些書註釋的連結不一定落在原位附近(不論是內文的註釋號連到註釋文,還是由註釋文回到內文註釋號皆然),在電子閱讀器上有時要向前或後揭一兩次才去到所需地方。
「《芝加哥格式手冊》(The Chicago Manual of Style)似乎對它就不大滿意,指出即使引用電子書,篇章或段落編號這類基於文本、不具任意性、沒有自創格式的分割標準依舊比較好,轉換便利優先於切割精細。手冊建議大家若真的不得不引用電子定位碼,至少要記得附上總數,例如「位置碼3023之444」,如此一來其他格式的讀者至少能大概推算索引條目落在什麼部分。」
看來可以方便實體書讀者的方法。
可是方某寫的電子書書介全部都沒包括總數這一點,畢竟寫書介的時候只顧抄下位置碼,根本沒留意原書(最後一頁)的位置碼編到哪裡。
「收藏在慕尼黑的巴伐利亞國立圖書館(Bayerische Staatsbibliothek)。」
成立當時的確是「國立」(巴伐利亞曾是獨立國家,港稱拜仁),現在似乎稱「州立」更貼切。
#1280 「薛佛代表了印刷時代初期的社會心態,並非想與過去切割乾淨。恰好相反,他們希望印製出來的書本與手抄本盡可能相似,若讀者無法分辨就再好不過。若要給頭十年的印刷業下個座右銘,大概會是「物美價廉」。挑選字體時盡量貼近筆跡,還在篇章開頭放上花俏大紅字以模仿手工雕琢感。薛佛書單的招牌是聖經,居然採用羊皮紙印刷。」
聖經用羊皮紙印刷以示尊貴,才不出奇吧﹖
#1669 第四章「索引還是在前面的,只不過分量和音量都不該喧賓奪主。21[127]」
21在這裡出現不知何解,因為前面的註釋已經編到122號,21顯然不是註釋號。而[127]看來是頁碼,抄筆記抄到這裡才發現原來本書的電子版終於加了頁碼。
#1786 第五章「一九九○年代末,有個網站嘗試將自然語言引入程式碼,避免使用者得跳脫日常生活的句法規則,而可以直接輸入例如:「請問外蒙的首都在哪裡?」這個網站叫做AskJeeves」
英國人應該不會用「外蒙」這個名吧﹖就算在台灣現在應該也不流行﹖
#1865 「接著指控對方只靠索引與字典做研究,「在我看來賓特利博士應該更深入鑽研文獻內容並諮詢原作者意見」」
這個評語其實是離奇的,因為學術討論從來不需要這樣。如果原作者死了難道要問米﹖
#1924 「雷伊先生對假具的定義。」
原來是指面具。
#2087 「他刻意淡化為何不經審判即處決犯人,答案是那些人本就被褫奪公權,失去法律賦予的身分和權利。」」
褫奪公權等於褫奪人權﹖褫奪公權只是剝奪政治權利呀。(但大陸對政治權利的解釋比台灣寬得多)
#2368 第六章「「卡塞爾國家圖書館系列」(Cassell’s National Library)」
這是常見的錯譯,但Library在這裡是指一大批文章的集合,而不是實體的一間圖書館。如果不要用中文「叢書」,這種Library實以日文「文庫本」的「文庫」稱之更妥。
#2386 「索引表格未必有何妙用,卻能營造尊爵不凡、豐盛華美的印象」
以為是「尊貴不凡」之誤。雖然在網上查到也有人用「尊爵不凡」,但這個詞是誰發明的﹖
#2410 「整個表格看上去像趕工出來而亂七八糟,根本派不上用場」
假手於人的結果。所以編索引確是一種苦差。
#2412 。一七一九年丹尼爾.笛福(Daniel Defoe)的《魯賓遜漂流記》(Robinson Crusoe)和一七二六年綏夫特的《格列佛遊記》(Gulliver’s Travels)都很成功。」
原來後者是長篇。
#2457 「譬如後面那條講的並不是任何「婚姻」,也不是夫妻一同到老,而是長者與年輕配偶成婚這樣清楚的前提。理查森透過小說提供讀者特殊情境下之道德困境的指引,索引則提高了讀者查詢的效率。」
誰要靠小說指引人生﹖
#2478 「可是友人並不買帳,根本沒打算閱讀索引《全集》,可見許多人並不希望小說成為佈道媒介。」
不完全是(也有人寫小說佈道,有些宗教出版社也出版小說),但至少讀者不會當成《聖經》這類宗教經典般去翻查吧。
#2498 「雖然後來學界針對字詞或主題習慣從牛津字典裡尋找最早的示例,詹森博士為每個釋義找出例句的做法非常成功,詞典成為透過索引學習的絕佳工具,羅賓.瓦倫扎(Robin Valenza)稱之為「索引學習的神化(apotheosis)」」
有多神化﹖
#2686 第七章「記者對美國代表團帶去展示的旋轉書櫃特別著迷,認為是「學生想給圖書館重新布置時的好選擇」。(但這話只說對一半:現在各大書店都有旋轉書櫃沒錯,學生單位反倒不常見。)」
「活動書櫃」﹖會旋轉的書櫃其實很費空間,書店也不一定有呀。(旋轉的雜誌架倒比較多)
但與旋轉書櫃相比,書店更少見到活動書櫃。
#2697 「各圖書館製作的目錄有太多重複內容,若能精簡這些過程,或許反倒省了所有人的時間。」
結果就是行內所謂「抄錄編目」(copy cataloging,簡稱copy cat)。
#2767 「泛用索引就像顆巨大的腦袋需要空間存放和整理資料,但學會並沒有與之相符的場地可用。六年後他們有了據點卻已經太遲,學會開始走下坡,儘管核心成員挹注很多心力仍未能點燃大眾的熱情。」
正如一個伺服器。
#2825 「普爾製作的索引每次標題頁都有同一句話,是他在耶魯求學時得自拉丁語教授的格言:Qui scit ubi sit scientia habenti est proximus──「知知識之所在,離知識不遠矣。」」
確焉。
#3102 第八章「這次他們將虛詞(function words,亦稱功能詞)放進詞庫,有and、but、the、with、this等五百多個。孛可的程式「閱讀」文件以後篩掉這些詞語,經過清掃還能倖存的就有資格進入索引。」
在搜尋引擎的術語稱為「stop words」,因為太常見又沒特定意義,所以搜尋引擎會直接跳過它們。
#3142 「嵌入式索引建立在數位標記的功能上,技術本質無異於網際網路的根基」
其實就是HTML的「超文本」標記語言所示的。
「現代人習慣電子裝置以後,不只對搜尋更講究,還對分類產生莫大熱情,話題標記(hashtag)就是個好例子。」
Hashtag只是個索引標籤不是分類吧,某件物事的hashtag可以有很多個,分類只能有一個。
#3264 「南希.貝利(Nancy Bailey)成立第一所限女性的索引公司」
這不算是性別歧視麼﹖抑或歧視男性就沒所謂﹖
#3437 附錄一「精準 accuracy, 100, 178 自以為 supposed, 15」
後者應該是次標題(即是自以為精準 supposed accuracy)而非同級標題,開新行後應右縮。
#5382 附錄二「《岸濱雜誌》 Strand Magazine」
刊名有時會音譯。
#5655 「此字母無詞條 X, no entries beginning with」
有必要這樣寫嗎﹖不是直接跳過字母就好﹖