{"entities":{"Q3116659":{"pageid":3127375,"ns":120,"title":"Item:Q3116659","lastrevid":80095988,"modified":"2026-05-06T15:25:56Z","type":"item","id":"Q3116659","labels":{"en":{"language":"en","value":"Solving semi-Markov decision problems using average reward reinforcement learning"}},"descriptions":{"en":{"language":"en","value":"scientific article; zbMATH DE number 6005771"}},"aliases":{},"claims":{"P31":[{"mainsnak":{"snaktype":"value","property":"P31","hash":"fd5912e4dab4b881a8eb0eb27e7893fef55176ad","datavalue":{"value":{"entity-type":"item","numeric-id":56887,"id":"Q56887"},"type":"wikibase-entityid"},"datatype":"wikibase-item"},"type":"statement","id":"Q3116659$68156995-5FD6-4712-BDF3-1F773D7C8859","rank":"normal"}],"P159":[{"mainsnak":{"snaktype":"value","property":"P159","hash":"681894767310747fa0bb202bd8285679d04c9ad0","datavalue":{"value":{"text":"Solving Semi-Markov Decision Problems Using Average Reward Reinforcement Learning","language":"en"},"type":"monolingualtext"},"datatype":"monolingualtext"},"type":"statement","id":"Q3116659$888A8F55-2071-4551-B7ED-10F63B4CEA7D","rank":"normal"}],"P225":[{"mainsnak":{"snaktype":"value","property":"P225","hash":"12578e55611157d3a569a60d79969b6fa8c81650","datavalue":{"value":"1231.90225","type":"string"},"datatype":"external-id"},"type":"statement","id":"Q3116659$5D688EB7-86EF-4C68-81C0-03B62D0828F6","rank":"normal"}],"P16":[{"mainsnak":{"snaktype":"value","property":"P16","hash":"f4437e01f3d9bc759867a8902df321de974cef4c","datavalue":{"value":{"entity-type":"item","numeric-id":444089,"id":"Q444089"},"type":"wikibase-entityid"},"datatype":"wikibase-item"},"type":"statement","id":"Q3116659$C1379DBF-EE0E-46D2-AB24-3958F1729BDE","rank":"normal"},{"mainsnak":{"snaktype":"value","property":"P16","hash":"bde1c6b9d428e031561b4e85281b94354a083df1","datavalue":{"value":{"entity-type":"item","numeric-id":421533,"id":"Q421533"},"type":"wikibase-entityid"},"datatype":"wikibase-item"},"type":"statement","id":"Q3116659$0E2B6914-B1FA-4544-A8E2-21177B2DCBCD","rank":"normal"},{"mainsnak":{"snaktype":"value","property":"P16","hash":"759b3aae397421acf70bae44ec50d673ec123ac5","datavalue":{"value":{"entity-type":"item","numeric-id":1267730,"id":"Q1267730"},"type":"wikibase-entityid"},"datatype":"wikibase-item"},"type":"statement","id":"Q3116659$7117C675-E3D5-40EA-898D-99BA0E67061C","rank":"normal"},{"mainsnak":{"snaktype":"value","property":"P16","hash":"aee1b77cab8e8e48dfb2be18f58ad4c7aedb8c31","datavalue":{"value":{"entity-type":"item","numeric-id":3116658,"id":"Q3116658"},"type":"wikibase-entityid"},"datatype":"wikibase-item"},"type":"statement","id":"Q3116659$F21BDCB4-DC0E-4537-A464-61F27BA5BB12","rank":"normal"}],"P200":[{"mainsnak":{"snaktype":"value","property":"P200","hash":"6e44c27f3d340aab0ff4982041b8ffdf589013f0","datavalue":{"value":{"entity-type":"item","numeric-id":65608,"id":"Q65608"},"type":"wikibase-entityid"},"datatype":"wikibase-item"},"type":"statement","id":"Q3116659$06BFA681-1E2B-4E96-AC3E-5F73E3AE1EB6","rank":"normal"}],"P28":[{"mainsnak":{"snaktype":"value","property":"P28","hash":"ba635942cb4f43d4ed08137830e8e93680747589","datavalue":{"value":{"time":"+2012-02-12T00:00:00Z","timezone":0,"before":0,"after":0,"precision":11,"calendarmodel":"http://www.wikidata.org/entity/Q1985727"},"type":"time"},"datatype":"time"},"type":"statement","id":"Q3116659$002AEB1E-F24F-4DC7-B623-D203D3DE61DE","rank":"normal"}],"P205":[{"mainsnak":{"snaktype":"value","property":"P205","hash":"ce02a87432262769fe86369b78167c18b3db1228","datavalue":{"value":"https://semanticscholar.org/paper/45295aa0fd92ecbad325ab8ba856ad8207ba3310","type":"string"},"datatype":"url"},"type":"statement","id":"Q3116659$9CEE4C84-CD81-47A7-A60E-7BF0751AE794","rank":"normal"}],"P226":[{"mainsnak":{"snaktype":"value","property":"P226","hash":"30d6d0de101c6ff200d712a6d7e331bcba20c783","datavalue":{"value":"90B40","type":"string"},"datatype":"external-id"},"type":"statement","id":"Q3116659$6E119EF6-DA33-4774-B538-18C42292DD6E","rank":"normal"}],"P1451":[{"mainsnak":{"snaktype":"value","property":"P1451","hash":"e1058001b90feccacaa0fb2c34f4b6ca0da3d19e","datavalue":{"value":"6005771","type":"string"},"datatype":"external-id"},"type":"statement","id":"Q3116659$FA694298-7FB3-4EE5-BE8D-612232242784","rank":"normal"}],"P1450":[{"mainsnak":{"snaktype":"value","property":"P1450","hash":"150d4af39fba04d22e3c20cd7dcc7f6283026f1a","datavalue":{"value":"semi-Markov decision processes (SMDP)","type":"string"},"datatype":"string"},"type":"statement","id":"Q3116659$C3003844-9D01-4EF9-8C94-E6C4EC15A973","rank":"normal"},{"mainsnak":{"snaktype":"value","property":"P1450","hash":"ab31482eee8f34fa99c5284980862acac4a0b6b4","datavalue":{"value":"reinforcement learning","type":"string"},"datatype":"string"},"type":"statement","id":"Q3116659$12F3D061-980C-40BA-935F-C5F5AB14CF49","rank":"normal"}],"P1460":[{"mainsnak":{"snaktype":"value","property":"P1460","hash":"57f7fea50d2ce1b39b695c4a1313582eed405e38","datavalue":{"value":{"entity-type":"item","numeric-id":5976449,"id":"Q5976449"},"type":"wikibase-entityid"},"datatype":"wikibase-item"},"type":"statement","id":"Q3116659$5BC3EB64-791B-45F8-B03E-1FB40383C204","rank":"normal"}],"P388":[{"mainsnak":{"snaktype":"value","property":"P388","hash":"bf41bb7fb89700949d700da2c82dce2fc8c28735","datavalue":{"value":"W2075754841","type":"string"},"datatype":"external-id"},"type":"statement","id":"Q3116659$A0408D6A-2ED7-4DB1-A498-2F8F6EB790FC","rank":"normal"}],"P27":[{"mainsnak":{"snaktype":"value","property":"P27","hash":"c2328317291f97de961f6ed5155a1c091940c69e","datavalue":{"value":"10.1287/MNSC.45.4.560","type":"string"},"datatype":"external-id"},"type":"statement","id":"Q3116659$278B71D1-F162-47F5-A988-2802B2C31910","rank":"normal"}],"P1643":[{"mainsnak":{"snaktype":"value","property":"P1643","hash":"211deb7b77feccf2b25464ffd26f654b5a33606e","datavalue":{"value":{"entity-type":"item","numeric-id":1427588,"id":"Q1427588"},"type":"wikibase-entityid"},"datatype":"wikibase-item"},"type":"statement","qualifiers":{"P1659":[{"snaktype":"value","property":"P1659","hash":"9c35b41e55acc7704a37a0421d2240557d473519","datavalue":{"value":{"amount":"+0.8652685284614563","unit":"1"},"type":"quantity"},"datatype":"quantity"}],"P1660":[{"snaktype":"value","property":"P1660","hash":"a327a09ea0305e98d5cf33bd4036320e19f2aed0","datavalue":{"value":{"entity-type":"item","numeric-id":6821328,"id":"Q6821328"},"type":"wikibase-entityid"},"datatype":"wikibase-item"}]},"qualifiers-order":["P1659","P1660"],"id":"Q3116659$C12354EA-E602-4170-9E86-A1A9B701F689","rank":"normal"},{"mainsnak":{"snaktype":"value","property":"P1643","hash":"f89dfae99ce42aa991721d414fcee47c33ef6f20","datavalue":{"value":{"entity-type":"item","numeric-id":859693,"id":"Q859693"},"type":"wikibase-entityid"},"datatype":"wikibase-item"},"type":"statement","qualifiers":{"P1659":[{"snaktype":"value","property":"P1659","hash":"af2fab4f34dfb95d3cd7d07f10ecd0e2ba9423f6","datavalue":{"value":{"amount":"+0.7915315628051758","unit":"1"},"type":"quantity"},"datatype":"quantity"}],"P1660":[{"snaktype":"value","property":"P1660","hash":"a327a09ea0305e98d5cf33bd4036320e19f2aed0","datavalue":{"value":{"entity-type":"item","numeric-id":6821328,"id":"Q6821328"},"type":"wikibase-entityid"},"datatype":"wikibase-item"}]},"qualifiers-order":["P1659","P1660"],"id":"Q3116659$EAB30E9A-9E03-4AE7-A36E-45AA9AD5D6BE","rank":"normal"},{"mainsnak":{"snaktype":"value","property":"P1643","hash":"caea8f3e5d6ee3348e311ce03b6e032bfaa37f0f","datavalue":{"value":{"entity-type":"item","numeric-id":3483104,"id":"Q3483104"},"type":"wikibase-entityid"},"datatype":"wikibase-item"},"type":"statement","qualifiers":{"P1659":[{"snaktype":"value","property":"P1659","hash":"9404d38dc228bf5115d827e1901a2b977acc2e07","datavalue":{"value":{"amount":"+0.7914830446243286","unit":"1"},"type":"quantity"},"datatype":"quantity"}],"P1660":[{"snaktype":"value","property":"P1660","hash":"a327a09ea0305e98d5cf33bd4036320e19f2aed0","datavalue":{"value":{"entity-type":"item","numeric-id":6821328,"id":"Q6821328"},"type":"wikibase-entityid"},"datatype":"wikibase-item"}]},"qualifiers-order":["P1659","P1660"],"id":"Q3116659$10D0A198-75EE-44CE-89B4-5811965B5071","rank":"normal"},{"mainsnak":{"snaktype":"value","property":"P1643","hash":"532a87b322abfc3b4ccd493eb3d2fbbb9a0a339e","datavalue":{"value":{"entity-type":"item","numeric-id":2901057,"id":"Q2901057"},"type":"wikibase-entityid"},"datatype":"wikibase-item"},"type":"statement","qualifiers":{"P1659":[{"snaktype":"value","property":"P1659","hash":"4b09549c7e0c1b3cae48d1c2133132b03be2e955","datavalue":{"value":{"amount":"+0.7894443869590759","unit":"1"},"type":"quantity"},"datatype":"quantity"}],"P1660":[{"snaktype":"value","property":"P1660","hash":"a327a09ea0305e98d5cf33bd4036320e19f2aed0","datavalue":{"value":{"entity-type":"item","numeric-id":6821328,"id":"Q6821328"},"type":"wikibase-entityid"},"datatype":"wikibase-item"}]},"qualifiers-order":["P1659","P1660"],"id":"Q3116659$82FBF830-7911-461A-8887-B45B345482AA","rank":"normal"},{"mainsnak":{"snaktype":"value","property":"P1643","hash":"88fca39b1da36bcbe95a5d7bcd919b44d70f6495","datavalue":{"value":{"entity-type":"item","numeric-id":3677539,"id":"Q3677539"},"type":"wikibase-entityid"},"datatype":"wikibase-item"},"type":"statement","qualifiers":{"P1659":[{"snaktype":"value","property":"P1659","hash":"c9cba88d01da96867b5a670c6f4ab33e4845590d","datavalue":{"value":{"amount":"+0.7888839840888977","unit":"1"},"type":"quantity"},"datatype":"quantity"}],"P1660":[{"snaktype":"value","property":"P1660","hash":"a327a09ea0305e98d5cf33bd4036320e19f2aed0","datavalue":{"value":{"entity-type":"item","numeric-id":6821328,"id":"Q6821328"},"type":"wikibase-entityid"},"datatype":"wikibase-item"}]},"qualifiers-order":["P1659","P1660"],"id":"Q3116659$A95980D4-6B45-4631-A9D9-7968F06614DF","rank":"normal"}]},"sitelinks":{"mardi":{"site":"mardi","title":"Solving semi-Markov decision problems using average reward reinforcement learning","badges":[],"url":"https://portal.mardi4nfdi.de/wiki/Solving_semi-Markov_decision_problems_using_average_reward_reinforcement_learning"}}}}}