Principes de modélisation
Date de création : 2020-10-20
Dernière mise à jour : 2023-05-26
The following modelling principles have guided and informed the development of the CIDOC CRM. |
Les principes de modélisation suivants ont guidé le développement du CIDOC CRM. |
Note de traduction |
|
---|---|
Références |
Reality, Knowledge Bases and CIDOC CRM - De la réalité, des bases de connaissance et du CIDOC CRM
The CIDOC CRM is a formal ontology in the sense introduced by (Guarino, 1998).4 The present document is intended to embrace an audience not specialized in computer science and logic; therefore, it focuses on the informal semantics and on the pragmatics of the CIDOC CRM concepts, offering a detailed discussion of the main traits of the conceptualization underlying the CIDOC CRM through basic usage patterns.5 The CIDOC CRM aims to assist sharing, connecting and integrating information from research about the past. In order to understand the function of a formal ontology of this kind, one needs to make the following distinctions:
A formal ontology, such as the CIDOC CRM, constitutes a controlled language for talking about particulars. I.e., it provides classes and properties for categorizing particulars as so-called “instances” in a way that their individuation, unity and relevant properties are as unambiguous as possible. For instance, Tut-Ankh Amun as instance of E21 Person is the real pharaoh from his birth to death, and not extending to his mummy, as follows from the specification of the class E21 Person and its properties in the CIDOC CRM. For clarification, the CIDOC CRM does not take a position against or in favour of the existence of spiritual substance nor of substance not accessible by either senses or instruments, nor does it suggest a materialistic philosophy. However, for practical reasons, it relies on the priority of integrating information based on material evidence available for whatever human experience. The CIDOC CRM only commits to a unique material reality independent from the observer. When we provide descriptions of particulars, we need to refer to them by unique names, titles or constructed identifiers, all of which are instances of E41 Appellation in the CIDOC CRM, in order for the reference to be independent of the context. (In contrast, reference to particulars by pronouns or enumerations of characteristic properties, such as name and birth date, are context dependent). The appellation, and the relation between the appellation and the referred item or relationship, must not be confused with the referred item and its identity. For example, Tut-Ankh Amun the name (instance of E41 Appellation) is different from Tut-Ankh Amun the person (instance of E21 Person) and also different from the relationship between name and person (P1 is identified by). Instances of CIDOC CRM classes are the real particulars, not their names, but in descriptions, names must be used as surrogates for the real things meant. Particulars are approximate individuations, like sections, of parts of reality. In other words, the uniqueness of reality does not depend on where one draws the line between the mountain and the valley. A CIDOC CRM-compatible knowledge base (KB) (Meghini & Doerr 2018) is an instance of E73 Information Object in the CIDOC CRM. It contains (data structures that encode) formal statements representing propositions believed to be true in a reality by an observer. These statements use appellations (e.g., http://id.loc.gov/authorities/names/n790660056) of ontological particulars and of CRM concepts (e.g., P100i died in). Thereby users, in their capacity of having real-world knowledge and cognition, may be able to relate these statements to the propositions they are meant to characterize, and be able to reason and research about their validity. In other words, the formal instances in a knowledge base are the identifiers, not the real things or phenomena. A special case is digital content: a KB in a computer system may contain statements about instances of E90 Symbolic Object and the real thing may be text residing within the same KB. The instance of E90 Symbolic Object and its textual representation are separate entities and they can be connected with the property P190 has symbolic content. Therefore, a knowledge base does not contain knowledge, but statements that represent knowledge, as long as there exist people that can resolve the identifiers used to their referents. (Appellations described in a knowledge base, and not used as primary substitutes of other items, are of course explicitly declared as instances of E41 Appellation in the knowledge base.) 4 Nicola Guarino defines a formal ontology as a specification of a set of named concepts used to describe and approximate a part of reality, plus a first-order logical theory narrowing down the intended meaning of the named concepts. 5 For the readers interested in computer science and logic, the syntax and formal semantics employed by the CIDOC CRM are given in (Meghini & Doerr 2018), where the computational aspects are also discussed. 6 The URI (instance of E41 Appellation) of the Library of Congress for Tut-Ankh-Amun, the pharaoh. |
Le CIDOC CRM est une ontologie formelle dans le sens que l’a introduit (Guarino, 1998)4. Ce document est destiné à une audience qui n’est spécialiste ni de la logique ni des sciences informatiques, de sorte qu’il se concentre sur la sémantique informelle et sur les aspects pragmatiques des concepts du CIDOC CRM. Il s’agit d’une discussion détaillée, à travers des patrons conceptuels fondamentaux5, des principes qui sous-tendent le CIDOC CRM, une ontologie qui a pour objectif de partager, de connecter et d’intégrer de l’information issue de recherches sur le passé. Afin de comprendre la fonction d’une telle ontologie formelle, les distinctions suivantes sont nécessaires :
Une ontologie formelle telle que le CIDOC CRM constitue en fait un langage contrôlé pour parler d’éléments particuliers, c.-à-d. qu’elle offre des classes et propriétés permettant de catégoriser ces éléments particuliers comme des « instances », de sorte que leur individuation, leur unité et les propriétés pouvant leur être associées de manière pertinente soient aussi claires que possible. Par exemple, Toutânkhamon comme instance de Le CIDOC CRM ne statue pas sur l’existence ou l’inexistence d’une substance spirituelle, ni sur l’existence ou l’inexistence d’une substance qui ne soit pas accessible par les sens ou par des instruments, et ne statue pas non plus en faveur d’une philosophie matérialiste. Cependant, pour des raisons pratiques, le CIDOC CRM repose sur la nécessité d’intégrer de l’information issue d’éléments matériels qui peuvent être appréhendés du fait de l’expérience humaine. Le CIDOC CRM renvoie en ce sens à une réalité matérielle indépendante de l’observateur. Lorsque des descriptions d’éléments particuliers sont disponibles, leurs identifiants, noms ou titres uniques (toutes des instances de Une base de connaissances (BC) compatible avec CIDOC CRM (Meghini & Doerr 2018) est une instance de Le contenu numérique fait cependant classe à part, car une BC peut contenir des énoncés au sujet d’instances de Une base de connaissances ne contient donc pas les connaissances elles-mêmes, mais bien les énoncés qui représentent ces connaissances tant et aussi longtemps que des personnes en mesure de résoudre les identifiants à leur référents sont présentes. Les appellations décrites dans une base de connaissances et qui ne sont pas utilisées comme auxiliaires principaux d’autres entités sont néanmoins toujours déclarées comme des instances de 4 Nicola Guarino définit une ontologie formelle comme la spécification d’un ensemble de concepts nommés et utilisés pour déterminer par approximation et pour décrire une part de la réalité, spécification à laquelle s’ajoute une théorie logique du premier ordre précisant la signification prévue de ces mêmes concepts nommés. 5 Les lecteurs intéressés par les sciences informatiques, la logique, la syntaxe et la sémantique formelles utilisées par le CIDOC CRM peuvent consulter (Meghini & Doerr 2018) qui examine les aspects computationnels de l’ontologie. 6 L’URI (instance de |
Note de traduction |
|
---|---|
Références |
Office québécois de la langue française. « base de connaissances ». Dans Grand dictionnaire terminologique. Québec, CA-QC: Office québécois de la langue française, 2017. http://gdt.oqlf.gouv.qc.ca/ficheOqlf.aspx?Id_Fiche=8366746. |
Authorship of Knowledge Base Contents - De l’auctorialité des contenus d’une base de connaissances
This section describes a recommended good practice how to relate authority to knowledge base contents. Statements in a KB must have been inserted by some human agent, either directly or indirectly. However, these statements often make no reference to that agent, lacking attribution of authority. An example of such statements in the CIDOC CRM is information expressed through shortcuts such as P2 has type. In the domain of cultural heritage, it is common practice that the responsibility for maintaining knowledge in the KB is elaborated in institutional policy or protocol documents. Thus, it is reasonable to hold that statements which lack explicit authority attribution can be read as the official view of the administrating institution of that system, i.e., the maintainers of the KB. This does not imply that the knowledge described in the KB is complete. So long as the information is under active management, it remains continuously open to revision and improvement as further research reveals further understandings.7 A KB does not represent a slice of reality, but the justified beliefs of its maintainers about that reality. For simplicity, we speak about a KB as representing some reality. Statements in a KB may also carry explicit references to agents that produced them, i.e., further statements of responsibility. In CIDOC CRM such statements of responsibility are expressed through knowledge creation events such as E13 Attribute Assignment and its relevant subclasses. Any knowledge that is about an explicit knowledge creation event, where the creator’s identity has been given, is implicitly attributed to be correctly referred to in the KB by the maintaining authority, whereas the responsibility for the content created by that event is assigned to the agent identified as causal to that event. In the special case of an institution taking over stewardship of a database transferred into their custody, two relations of responsibility for the knowledge therein can be envisioned. If the institution accepts the dataset and undertakes to maintain and update it, then they take on responsibility for that information and become the default authority behind its statements as described above. If, on the other hand, the institution accepts the data set and stores it without change as a closed resource, then it can be considered that the default authority remains the original steward like for any other scholarly document kept by the institution. 7 Statements in a KB may be in contradiction to the ontologically defined quantification of properties without the KB being broken or invalid in any sense, either because necessary properties are unknown or there exist good reasons to assume alternative values for properties with limited cardinality, be it by the same or by different maintainers. |
Cette section présente les pratiques exemplaires qui s'appliquent lors de la liaison de contenu d’autorité aux contenus d’une base de connaissances (BC). Les énoncés d’une BC doivent avoir été introduits par un agent humain de manière directe ou indirecte, mais ils ne font souvent pas explicitement référence à cet agent, de sorte que l’autorité sous laquelle une information a été émise n’est pas établie (c’est le cas, par exemple, lors de l’utilisation de raccourcis tels que Les énoncés d’une BC peuvent toutefois avoir des références explicites aux agents qui les ont produits (c.-à-d. des énoncés de responsabilité supplémentaires [n.d.t. qui s’ajoutent à l’énoncé institutionnel implicite]). Dans CIDOC CRM, de tels énoncés de responsabilité prennent la forme d’évènements de création de connaissances par le biais de Lorsqu’une institution prend à sa charge une base de données dans le cadre d’un transfert de sa garde d’une autorité administrative à une autre, deux relations de responsabilité sur les connaissances de cette BC sont possibles. Si l’institution hôte accepte la responsabilité du maintien des informations, elle devient l’autorité associée par défaut aux énoncés qui s’y trouvent. Si, par contre, l’institution hôte traite l’ensemble des données comme une ressource « fermée » [n.d.t. donc traité à la manière d’un artéfact], l’autorité associée par défaut aux énoncés qui s’y trouvent sera celle de l’institution initiale (comme c’est le cas de tout autre document de recherche se trouvant dans la collection de l’institution hôte). [n.d.t. voir « Processus de création de connaissances » dans la section Terminologie.] 7 Les énoncés se trouvant dans une BC peuvent entrer en contradiction avec la quantification ontologique des propriétés sans que cette BC ne soit pour autant dysfonctionnelle ou invalidée. Une telle situation pourrait survenir soit parce que des propriétés sont inconnues, soit parce qu’il est raisonnable pour l’institution ou personne responsable du maintien de penser que des valeurs alternatives sont possibles pour des propriétés dotées d’une cardinalité limitée. |
Note de traduction |
|
---|---|
Références |
Extensions of CIDOC CRM - Des extensions de CIDOC CRM
Since the intended scope of the CIDOC CRM is a subset of the “real” world and is therefore potentially infinite, the model has been designed to be extensible through the linkage of compatible external type hierarchies. Of necessity, some concepts covered by the CIDOC CRM are defined in less details than others: E39 Actor and E30 Right, for example. This is a natural consequence of staying within the model’s clearly articulated practical scope in an intrinsically unlimited domain of discourse. These ‘underdeveloped’ concepts can be considered as candidate superclasses for compatible extensions, in particular for disciplines with a respective focus. Additions to the model are known as extensions while the main model is known as CRMbase. Compatibility of extensions with the CRM means that data structured according to an extension must also remain valid as instances of CIDOC CRM base classes. In practical terms, this implies query containment: any queries based on CIDOC CRM concepts to a KB should retrieve a result set that is correct according to the model’s semantics, regardless of whether the KR is structured according to the CIDOC CRM’s semantics alone, or according to the CIDOC CRM plus compatible extensions. For example, a query such as “list all events” should recall 100% of the instances deemed to be events by the CIDOC CRM, regardless of how they are classified by the extension. A sufficient condition for the compatibility of an extension with the CIDOC CRM is that its classes, other than E1 CRM Entity, subsume all classes of the extension, and all properties of the extension are either subsumed by CRM properties, or are part of a path for which a CIDOC CRM property is a shortcut, and that classes and properties of the extension can be well distinguished from those in the CIDOC CRM. For instance, a class “tangible object” may be in conflict with existing classes of the CIDOC CRM. Obviously, such a condition can only be tested intellectually. The CRM provides a number of mechanisms to ensure that coverage of the intended scope can be increased on demand without losing compatibility:
Following strategies 1, 2 and 3 will have the result that the CIDOC CRM concepts subsume and thereby cover the extensions. This means that querying an extended knowledge base only with concepts of the CIDOC CRM will nevertheless retrieve all facts described via the extensions. In mechanism 3, the information in the notes is accessible in the respective knowledge base by retrieving the instances of E1 CRM Entity that are domain of P3 has note. Keyword search will also work for the content of the note. Rules should be applied to attach a note to the item most specific for the content. For instance, details about the role of an actor in an activity should be associated with the instance of E7 Activity, and not with the instance of E39 Actor. This approach is preferable when queries relating elements from the content of such notes across the knowledge base are not expected. In general, only concepts to be used for selecting multiple instances from the knowledge base by formal querying need to be explicitly modelled. This criterion depends on the expected scope and use of the particular knowledge base. The CIDOC CRM prioritizes modelling the kinds of facts one would like to retrieve and relate from heterogeneous content sources, potentially from different institutions. It does not, by way of contrast, focus on the modelling of facts with a more local scope such as the administrative practices internal to an institution. Mechanism 4, conservative extension, is more complex:
With increasing use of the CIDOC CRM, there is also a need for extensions that model phenomena from a scope wider than the original one of the CIDOC CRM, but which are also applicable to the concepts that do fall within the CIDOC CRM’s scope. When this occurs, properties of the CIDOC CRM may be found to be applicable more generally to superclasses of the extension than to those of their current domain or range in the CIDOC CRM. This is a consequence of the key principle of the CIDOC CRM to model “bottom up”, i.e., selecting the domains and ranges for properties to be as narrow as they would apply in a well understood fashion in the current scope, thus avoiding making poorly understood generalizations at risk of requiring non-monotonic correction. The fourth mechanism for extending the CIDOC CRM by conservation extension can be seen to be split into two cases: 1) A new class or property is added to an extension of the CIDOC CRM, which is not covered by superclasses other than E1 CRM Entity or a superproperty in the CIDOC CRM respectively. In this case, all facts described only by such concepts are not accessible by queries with CIDOC CRM concepts. Therefore, the extension should publish in a compatibility statement the additional relevant high-level classes and properties needed to retrieve all facts documented with the extended model. This case is a monotonic extension. 2) The domain or range of an existing property in the CIDOC CRM is changed to a superclass of the one or the other or both, because the property is understood to be applicable beyond its originally anticipated scope. In this case, all facts described by the extension are still accessible by querying with the concepts of the CIDOC CRM, but the extension can describe additional facts that the CIDOC CRM could not. This case is a monotonic extension and generally recommended, because it enables bottom-up evolution of the model. If this change is part of a new release of the CIDOC CRM itself, it is simply backwards compatible, and this has been done frequently in the evolution of this model. If case (2) should be documented and implemented in an extension module separate from the CIDOC CRM, it may come in conflict with the current way knowledge representation languages, such as RDF/OWL, treat it, because in formal logic changing the range or domain of a property is regarded as changing the ontological meaning completely; there is no distinction between the meaning of the property independent of domain and range and the specification of the domain and range. It is, however, similar to what in logic is called a conservative extension of a theory, and necessary for an effective modular management of ontologies. Therefore, for the interested reader, we describe here a definition of this case in terms of first order logic, which shows how modularity can formally be achieved: Let us assume a property P defined with domain class A and range class C also holds for a domain class B, superclass of A, and a range class D, superclass of C, in the sense of its ontological meaning in the real world. We describe this situation by introducing an auxiliary formal property P’, defined with domain class B and range class D, and apply the following logic: A(x) ⇒ B(x) C(x) ⇒ D(x) P(x,y) ⇒ A(x) P(x,y) ⇒ C(y) P’(x,y) ⇒ B(x) P’(x,y) ⇒ D(y) Then, P’ is a conservative extension of P if: A(x) ∧ C(y) ∧ P’(x,y) ⇔ P(x,y) In other words, a separate extension module may re-declare the respective property with another identifier, preferably using the same label, and implement the above rule. |
Puisque le domaine d’application du CIDOC CRM est en fait un sous-ensemble du monde « réel » qui lui est infini, le modèle a été conçu pour être extensible [n.d.t. afin de répondre aux différents besoins de documentation qui pourraient en émerger]. Cette extensibilité repose en grande partie sur la possibilité d’établir des liens avec des systèmes externes compatibles hiérarchisés par types. Certains concepts du CIDOC CRM sont nécessairement définis plus précisément que d’autres du fait de son application pratique dans un domaine discursif qui est, lui, illimité (p. ex. les classes La compatibilité des extensions repose sur le fait que les données structurées selon celles-ci demeurent des instances valides des classes de CRMbase. Ceci exige, d’un point de vue pratique, un encadrement des requêtes, de sorte que toute requête d’une base de connaissances (BC) basée sur des concepts du CRMbase doit générer des résultats qui s’alignent avec la sémantique du modèle, et ce peu importe si la représentation de ces connaissances (RC) est structurée uniquement selon CRMbase ou si elle repose aussi en partie sur ses extensions. Par exemple, une requête telle que « énumérer tous les évènements » devrait générer 100 % des instances considérées comme des évènements par le CRMbase peu importe la manière dont elles sont classifiées par les extensions du modèle. Un seuil acceptable de compatibilité d’une extension avec le CIDOC CRM est notamment établi par les conditions suivantes (qui doivent toutes être remplies) :
Le CRMbase fournit un certain nombre de mécanismes d’extensibilité afin que son domaine d’application initial puisse être élargi sans pour autant compromettre sa compatibilité :
L’utilisation des stratégies [n.d.t. aussi nommées mécanismes] 1, 2 et 3 entraîne une subsomption des extensions par le CRMbase et, de fait, leur couverture complète par ce dernier, de sorte qu’une requête n’utilisant que des concepts du CRMbase dans une base de connaissances extensionnée [n.d.t. mobilisant des extensions] aura pour résultat une extraction de tous les éléments décrits par le biais de ces extensions. Dans le cas du troisième mécanisme [n.d.t. l’utilisation de notes pour représenter des données non structurées], l’information contenues dans les notes est accessible depuis la base de connaissances en extrayant les instances de De manière générale, seuls les concepts soumis à des requêtes formelles sélectionnant des instances multiples de la base de connaissances nécessitent une modélisation explicite; ceci repose cependant sur les applications anticipée et pratique de la base de connaissances. Le CIDOC CRM accorde en effet une importance particulière à la modélisation des éléments qu’un utilisateur aimerait extraire et lier depuis des sources hétérogènes (voire inter-institutionnelles) de contenus. Il ne priorise donc pas la modélisation d’éléments dont l’application est localisée et spécifique telles que les pratiques administratives internes d’une institution. Le quatrième mécanisme (l’extension conservatrice) est plus complexe : [n.d.t. L’utilisation des extension conservatrices découle d’un] usage accru du CIDOC CRM dont émane le besoin de modéliser des phénomènes issus d’un domaine d’application plus large que celui qu’avait initialement anticipé le modèle bien que ceux-ci s’inscrivent néanmoins dans le domaine d’application des concepts de CRMbase. Dans de tels cas, les propriétés de CRMbase s’avèrent souvent applicables aux super-classes des extensions de manière plus générale qu’elles ne s’appliquent à leur domaine et/ou à leur portée dans CRMbase. Ceci résulte de l’approche « ascendante » [n.d.t. élaboration d’un tout depuis ses parties nécessaires, appelée en anglais « bottom-up”] privilégiée par le CIDOC CRM et selon laquelle les domaines et portées des propriétés sont aussi étroitement définis que possible dans le cadre du domaine d’application concerné (et ce afin d’éviter des généralisations qui exigeraient des corrections non monotones ou induiraient des mécompréhensions). Ce quatrième mécanisme d’extension de CIDOC CRM peut être divisé en deux scénarios :
La documentation et l’implémentation de ce second scénario dans le cadre d’un module distinct du CRMbase peut mener à des conflits lors du traitement par des langages de représentation des connaissances tels que RDF/OWL. Ceci est dû au fait que, du point de vue de la logique formelle, la modification du domaine ou de la portée d’une propriété constitue un changement de signification ontologique complet : il n’y a pas de distinction, dans ce contexte, entre la signification de la propriété (indépendamment de son domaine et de sa portée) et la spécialisation de son domaine et de sa portée. Ceci est comparable à l’extension conservatrice d’une théorie dans un contexte logique, une pratique nécessaire à la gestion modulaire d’ontologies de manière efficace. Un tel cas décrit en logique du premier ordre illustre comment atteindre la modularité formellement dans ce contexte : Assumant qu’une propriété Cette situation peut être décrite plus aisément par l’introduction d’une propriété La logique suivante s’applique donc : A(x) ⇒ B(x) C(x) ⇒ D(x) P(x,y) ⇒ A(x) P(x,y) ⇒ C(y) P’(x,y) ⇒ B(x) P’(x,y) ⇒ D(y) Ainsi, En d’autres termes, un module d’extension distinct peut re-déclarer une propriété avec un autre identifiant (préférablement en utilisant une même étiquette) et implémenter la règle ci-haut. |
Note de traduction |
Certains paragraphes ont été édités dans la version francophone à des fins de compréhension. Les sections concernées sont indiquées de [n.d.t. texte concerné]. Le terme « fact » pour référer à un élément se trouvant dans une base de connaissances a été traduit par « élément » puisqu’il ne semble pas y avoir de référence à la nature attestée de l’élément en question. |
---|---|
Références |
Wikipédia. « Extension conservatrice ». Dans Wikipédia. San Francisco, US-CA: Wikipédia, 17 décembre 2017. https://fr.wikipedia.org/w/index.php?title=Extension_conservatrice&oldid=143598511. ———. « Monotonie ». Dans Wikipédia. San Francisco, US-CA: Wikipédia, 19 février 2017. https://fr.wikipedia.org/w/index.php?title=Monotonie&oldid=134697868. |
Minimality - De la minimalité
Although the scope of the CIDOC CRM is very broad, the model itself is constructed as economically as possible.
A CIDOC CRM class is declared when:
|
Bien que le domaine d’application du CIDOC CRM soit très large, le modèle lui-même promeut une économie de moyens, de sorte que :
Une classe CIDOC CRM est déclarée lorsque :
|
Note de traduction |
Certains paragraphes ont été édités dans la version francophone à des fins de compréhension. Les sections concernées sont indiquées de [n.d.t. texte concerné]. |
---|---|
Références |
Shortcuts - Des raccourcis
Some properties are declared as shortcuts of longer, more comprehensively articulated paths that connect the same domain and range classes as the shortcut property via one or more intermediate classes. For example, the property E18 Physical Thing. P52 has current owner (is current owner of): E39 Actor, is a shortcut for a fully articulated path from E18 Physical Thing through E8 Acquisition to E39 Actor. An instance of the fully-articulated path always implies an instance of the shortcut property. However, the inverse may not be true; an instance of the fully-articulated path cannot always be inferred from an instance of the shortcut property inside the frame of the actual KB The class E13 Attribute Assignment allows for the documentation of how the assignment of any property came about, and whose opinion it was, even in cases of properties not explicitly characterized as “shortcuts”. |
Certaines propriétés sont déclarées être des raccourcis de chemins sémantiques plus exhaustifs et détaillés qui relient les mêmes classes de domaine et de portée que la propriété-raccourci, mais utilisent une ou plusieurs classes intermédiaires. Par exemple, la propriété La classe |
Note de traduction |
|
---|---|
Références |
Monotonicity - De la monotonicité
The CIDOC CRM’s primary function is to support the meaningful integration of information in an Open World. The adoption of the Open World principle means that the CIDOC CRM itself must remain fundamentally open and knowledge bases implemented using it should be flexible enough to receive new insights. At the model level, new classes and properties within the CIDOC CRM’s scope may be found in the course of integrating more documentation records or when new kinds of relevant facts come to the attention of its maintainers. At the level of the KBs, the need to add or revise information may arise due to numerous external factors. Research may open new questions; documentation may be directed to new or different phenomena; natural or social evolution may reveal new objects of study.
It is the aim of the maintainers of the CIDOC CRM to respect the Open World principle and to follow the principle of monotonicity. Monotonicity requires that adding new classes and properties to the model or adding new statements to a knowledge base does not invalidate already modelled structures and existing statements. A first consequence of this commitment, at the level of the model, is that the CIDOC CRM aims to be monotonic in the sense of Domain Theory. That is to say, the existing CIDOC CRM constructs and the deductions made from them should remain valid and well-formed, even as new constructs are added by extensions to the CIDOC CRM. Any extensions should be, under this method, backwards compatible with previous models. The only exception to this rule arises when a previous construct is considered objectively incorrect by the domain experts and thus subjected to corrective revision. Adopting the principle of monotonicity has active consequences for the basic manner in which classes and properties are designed and declared in the CIDOC CRM. In particular, it forbids the declaration of complement classes, i.e., classes solely defined by excluding instances of some other classes. For example: FRBRoo (Bekiari et al (eds). 2015) extends the CIDOC CRM. In version 2.4 of FRBRoo, F51 Name Use Activity was declared as a subclass to the CIDOC CRM class E7 Activity. This class was added in order to describe a phenomenon specific to library practice and not considered within CRM base. F51 Name Use Activity describes the practice of an instance of E74 Group adopting and deploying a name within a context for a time-span. The creation of this extension is monotonic because no existing IsA relationship or inheritance of properties in CRM base are compromised and no future extension is ruled out. By way of contrast, if, to handle this situation, a subclass “Other Activity” had been declared, a non-monotonic change would have been introduced. This would be the case because the scope note of a complement class like “Other Activities” would forbid any future declaration of specializations of E7 Activity such as ‘Name Use Activity’. In the case the need arose to declare a particular specialized subclass, a non-monotonic revision would have to be made, since there would be no principled way to decide which instances of ‘Other Activity’ were instances of the new, specialized class and which were not. Such non-monotonic changes are extremely costly to end users, compromising backwards compatibility and long-term integration. As a second consequence, maintaining monotonicity is also required during revising or augmenting data within a CIDOC CRM compatible system. That is, existing CIDOC CRM instances, their properties and the deductions made from them, should always remain valid and well-formed, even as new instances, regarded as consistent by the domain expert, are added to the system. For example: If someone describes correctly that an item is an instance of E19 Physical Object, and later it is correctly characterized as an instance of E20 Biological Object, the system should not stop treating it as an instance of E19 Physical Object. This is achieved by declaring E20 Biological Object as subclass of E19 Physical Object. This example further demonstrates that the IsA hierarchy of classes and properties can represent characteristic stages of increasing knowledge about some item during the processes of investigation and collection of evidence. Higher level classes can be used to safely classify objects whose precise characteristics are not known in the first instance. An ambiguous biological object may, for example, be classified as only a physical object. Subsequent investigation can reveal its nature as a biological object. A knowledge base constructed with CIDOC CRM classes designed to support monotonic revision allows for seeking physical objects that were not yet recognized as biological ones. This ability to integrate information with different specificity of description in a well-defined way is particularly important for large-scale information integration. Such a system supports scholars being able to integrate all information about potentially relevant phenomena into the information system without forcing an over or under commitment to knowledge about the object. Since large scale information integration always deals with different levels of knowledge of its relevant objects, this feature enables a consistent approach to data integration. A third consequence, applied at the level of the knowledge base, is that in order to formally preserve monotonicity, when it is required to record and store alternative opinions regarding phenomena all formally defined properties should be implemented as unconstrained (many: many) so that conflicting instances of properties are merely accumulated. Thus, integrated knowledge can serve as a research tool for accumulating relevant alternative opinions around well-defined entities, whereas conclusions about the truth are the task of open-ended scientific or scholarly hypothesis building. For example: King Arthur’s basic life events are highly contested. Once entered in a knowledge base, he should be defined as an instance of E21 Person and treated as having existed as such within the sense of our historical discourse. The instance of E21 Person is used as the collection point for describing possible properties and existence of this individual. Alternative opinions about properties, such as the birthplace and his living places, should be accumulated without validity decisions being made during data compilation. King Arthur may be entered as a different instance, of E28 Conceptual Object, for describing him as mythological character and accumulating possibly mythological facts. The fourth consequence of monotonicity relates to the use of time dependent properties in a knowledge base. Certain properties declared in the CIDOC CRM, such as having a part, an owner or a location, may change many times for a single item during the course of its existence. Asserting that such a property holds for some item means that that property held for some particular, undetermined time-span within the course of its existence. Consequently, one item may be the subject of multiple statements asserting the instantiation of that property without conflict or need for revision. The collection of such statements would reflect an aggregation of these instances of this property holding over the time-span of the item’s existence. If a more specific temporal knowledge is required/available, it is recommended to explicitly describe the events leading to the assertion of that property for that item. For example, in the case of acquiring or losing an item, it would be appropriate to declare the related event class such as E9 Move. By virtue of this principle, the CRM achieves monotonicity with respect to an increase of knowledge about the states of an item at different times, regardless of their temporal order. Time-neutral properties may be specialized in a future monotonic extension by time-specific properties, but not vice-versa. Also, many properties registered do not change over time or are relative to events in the model already. Therefore, the CIDOC CRM always gives priority to modelling properties as time-neutral, and rather representing changes by events. However, for some of these properties many databases may describe a “current” state relative to some property, such as “current location” or “current owner”. Using such a “current” state means that the database manager is able to verify the respective reality at the latest date of validity of the database. Obviously, this information is non-monotonic, i.e., it requires deletion when the state changes. In order to preserve a reduced monotonicity, these properties have time-neutral superproperties by which respective instances can be reclassified if the validity becomes unknown or no longer holds. Therefore, the use of such properties in the CRM is only recommended if they can be maintained consistently. Otherwise, they should be reclassified by their time-neutral superproperties. This holds in particular if data is exported to another repository, see also the paragraph “Authorship of Knowledge Base Contents”. |
La fonction primaire du CIDOC CRM est de soutenir l’intégration d’information sur la base de l’hypothèse du monde ouvert [n.d.t. selon laquelle la véracité d'une affirmation ne repose pas sur le fait qu’un agent ou un observateur sache qu’elle est vraie]. Ceci implique que le CIDOC CRM lui-même doit être ouvert et que les bases de connaissances implémentées avec celui-ci doivent être suffisamment flexibles pour accueillir de nouvelles idées. Au niveau du modèle, ceci implique que de nouvelles classes et/ou propriétés puissent être créées lors de l’intégration de nouveaux enregistrements documentaires ou lorsque [n.d.t. la nécessité de représenter] des éléments inédits est portée à l’attention des responsables du CIDOC CRM. Au niveau des bases de connaissances, la nécessité d’ajouter ou de réviser de l’information en raison de facteurs externes doit être prise en compte (de tels facteurs incluent, par exemple, l’avancement du milieu de la recherche qui soulève de nouvelles questions, la documentation de nouveaux phénomènes, ou encore l’évolution sociale ou naturelle qui révèle de nouveaux objets d’étude). Les responsables du CIDOC CRM ont pour objectif de respecter les tenants de l’hypothèse du monde ouvert, en particulier le principe de la monotonicité qui exige que l’ajout de nouvelles classes et/ou propriétés (au modèle) ou de nouveaux énoncés (à la base de connaissances) n’invalident pas les structures et énoncés pré-existants [n.d.t. voir Raisonnement monotone dans la section Terminologie]. La première conséquence de ce choix est que le CIDOC CRM tente d’être monotone au sens de la théorie des domaines : les construits du CIDOC CRM et les déductions qui peuvent en découler doivent donc demeurer formellement et conceptuellement valides malgré l’ajout de construits issus d’extensions du CIDOC CRM, de sorte que toute extension doit être rétro-compatible avec les modèles qui la précèdent. La seule exception à cette règle serait une situation où un construit est considéré objectivement incorrect par les experts du domaine dont ce construit émane et qu’il soit en conséquence soumis à une révision corrective. L’adoption du principe de monotonicité a des conséquence notables sur la manière dont les classes et propriétés sont conceptualisées et déclarées dans le CIDOC CRM, car cela interdit la déclaration de classes complémentaires (c.-à-d. des classes définies uniquement par l’exclusion d’instances d’autres classes). Par exemple : FRBRoo (Bekiari et al (eds). 2015), qui extensionne le CIDOC CRM, a dans sa version 2.4 une classe La seconde conséquence de ce choix [n.d.t.méthodologique d’adopter l’hypothèse du monde ouvert] est qu’il est nécessaire de maintenir la monotonicité même lors de la révision ou de l’ajout de données dans des systèmes compatibles avec le CIDOC CRM. En d’autres termes, les instances des classes du CIDOC CRM, leurs propriétés et les déductions qui en découlent doivent demeurer formellement et conceptuellement valides, et ce même lorsque de nouvelles instances considérées par les experts d’un domaine précis considèrent qu’elles s’insèrent de manière cohérente dans l’ensemble du système. Par exemple : Si quelqu’un indique correctement qu’un élément est une instance de Cet exemple démontre en outre que la hiérarchie La troisième conséquence de ce choix [n.d.t. d’une méthodologie monotone] est la nécessité d’une implémentation formelle illimitée (plusieurs à plusieurs) des propriétés recensant des enregistrements ou opinions alternatifs au sujet de phénomènes dans une base de connaissances, de telle sorte que des instances qui pourraient s’avérer conflictuelles s’accumulent [n.d.t. plutôt que d’établir des contradictions]. Ainsi, les bases de connaissances [n.d.t. où se retrouvent les informations et savoirs intégrés] peuvent être utilisées afin d’accumuler ou de recenser des opinions alternatives pertinentes au sujet d’un phénomène par l’utilisation d’entités sémantiques clairement définies alors que les constats experts ou conclusions sur ce même sujet [n.d.t. qui peuvent s’appuyer sur l’information trouvée dans ces bases de connaissances] relèvent de l’analyse scientifique ou experte. Par exemple : Les évènements rythmant la vie du Roi Arthur font l’objet de beaucoup de spéculations et de désaccords [n.d.t. qui doivent néanmoins être recensés dans les bases de connaissances traitant de lui]. Le CIDOC CRM préconise un recensement selon la formule suivante : Une fois recensé dans une base de connaissances, le Roi Arthur [n.d.t. en tant qu’individu] devrait être défini comme une instance de Le recensement du Roi Arthur à titre de figure mythologique [n.d.t. plutôt que comme individu historique] requiert pour sa part une instance de La quatrième conséquence de ce choix d’une méthodologie monotone [n.d.t. reposant sur l’hypothèse du monde ouvert] est la possibilité pour certaines propriétés de nature temporelle (telles que celles qui se rapportent au fait d’avoir des composantes, des propriétaires ou des localisations) de changer plusieurs fois en référence à un même élément au cours de son existence. Dans ce contexte, affirmer qu’une propriété est valide pour un élément implique qu’elle soit aussi valide pour un intervalle temporel particulier, mais indéterminé et situé dans le cours de l'existence de ce même élément. Il en résulte qu’un même élément puisse faire l’objet de nombreux énoncés affirmant l’instanciation d’une propriété sans que ceci ne soit conflictuel ou ne nécessite de révision. La collecte de tels énoncés résulterait ainsi en une agrégation des instances de cette propriété en tant qu’elle s’applique à l’entièreté de l’existence de l’élément. Si des informations temporelles plus spécifiques sont nécessaires ou disponibles, il est recommandé de décrire explicitement les évènements qui sous-tendent l’application d’une propriété à un élément. Par exemple : Si un élément fait l’objet d’une acquisition ou d’une perte, une instance de Des propriétés temporellement neutres peuvent faire l’objet d’une spécialisation par des propriétés temporellement spécifiques dans le cadre d’extensions monotones futures, mais le contraire n’est pas possible. En outre, plusieurs propriétés du CIDOC CRM n’ont pas de composante temporelle ou sont déjà définies par rapport à des évènements précis [n.d.t. et celles-ci devraient être envisagées avant la création de nouvelles propriétés]. Le CIDOC CRM privilégie la modélisation de propriétés qui sont temporellement neutres et l’utilisation d’évènements pour représenter le changement. Toutefois, dans le cas de certaines de ces propriétés, de nombreuses bases de données indiqueront parfois un statut « actuel » relatif à une autre propriété (p. ex. « localisation actuelle » ou « propriétaire actuel »). L’utilisation d’un tel état « actuel » implique que le responsable de la base de données en question soit garant de l’information en date de la dernière date statuant la validité des contenus. Cette information, évidemment, est de nature non monotone (c.-à-d. qu’elle doit être supprimée lorsque l’état de l’élément change). Afin de préserver malgré cela une forme (réduite) de monotonicité, de telles propriétés s’inscrivent dans les super-propriétés temporellement neutres qui permettent de reclassifier leurs instances dans l’éventualité où la validité de cette information échoit ou devient inconnue. Ainsi, l’usage de telles propriétés dans le cadre du CIDOC CRM n’est recommandé que lorsque leur maintien régulier et rigoureux peut être assuré, sans quoi ces propriétés devraient être reclassifiées en faveur de leur super-propriétés temporellement neutres; cette pratique s’applique notamment lors de l’exportation de données vers des répertoires autres (voir De l’auctorialité des contenus d’une base de connaissances). |
Note de traduction |
Certains paragraphes ont été édités dans la version francophone à des fins de compréhension. Les sections concernées sont indiquées de [n.d.t. texte concerné]. |
---|---|
Références |
Wikipédia. « Monotonie ». Dans Wikipédia. San Francisco, US-CA: Wikipédia, 19 février 2017. https://fr.wikipedia.org/w/index.php?title=Monotonie&oldid=134697868. |
Disjointness - De la disjonction
Classes are disjoint if they cannot share any common instances at any time, past, present or future. That implies that it is not possible to instantiate an item using a combination of classes that are mutually disjoint or with subclasses of them (see “multiple instantiation” in section “Terminology”). There are many examples of disjoint classes in the CIDOC CRM. A comprehensive declaration of all possible disjoint class combinations afforded by the CIDOC CRM has not been provided here; it would be of questionable practical utility, and may easily become inconsistent with the goal of providing a concise definition. However, there are two key examples of disjoint class pairs that are fundamental to effective comprehension of the CIDOC CRM:
|
Des classes qui ne peuvent pas partager d’instances à quelque moment que ce soit (par le passé, dans le présent ou dans le futur) sont qualifiées de disjointes. Un élément ne peut pas être instancié avec une combinaison de classes qui sont mutuellement disjointes ou qui sont des sous-classes de super-classes mutuellement disjointes (voir « Instanciation multiple » dans la section Terminologie). Il y a de nombreuses paires de classes disjointes dans le CIDOC CRM et une déclaration exhaustive de toutes les combinaisons possibles de celles-ci n’aurait qu’une utilité pratique limitée, en plus d’entrer en conflit avec l’objectif du CIDOC CRM d’offrir des définitions concises, de sorte qu’une telle liste n’est pas recensée ici. Deux exemples emblématiques de disjonction de classes sont néanmoins essentiels à une bonne compréhension du CIDOC CRM :
|
Note de traduction |
|
---|---|
Références |
Inheritance and Transitivity - De l’héritage et de la transitivité
CIDOC CRM is formulated as a class system with inheritance. A property P with domain A and range B will also be a property between any possible subclasses of A and of B. In many cases there will be a common subclass C of both A and B. In these cases, when the property is restricted to C, that is, with C as domain and range, the restricted property could be transitive. For instance, an E73 Information Object can be incorporated into an E90 Symbolic Object and thus an information object can be incorporated in another information object. In the definition of CIDOC CRM the transitive properties are explicitly marked as such in the scope notes. All unmarked properties should be considered as not transitive. |
Le CIDOC CRM est un système de classe dotées d’héritage, de telle manière qu’une propriété Les propriétés transitives sont explicitement indiquées comme telles dans les notes d’application du CIDOC CRM, si bien que les propriétés dénuées de cette mention doivent être considérées comme non transitives. |
Note de traduction |
Certains paragraphes ont été édités dans la version francophone à des fins de compréhension. Les sections concernées sont indiquées de [n.d.t. texte concerné]. |
---|---|
Références |